食のいま

応用生命科学部/食品科学科MENU
日本獣医生命科学大学 日本獣医生命科学大学
前へ戻る

第73号:食品科学科のデータサイエンス教育

 2023年の今年は、ChatGPT、BingAI、Bard、Stable Diffusionなどの生成系AIのサービスを多くの人が認識した年になるでしょう。これら生成系AIの背景には、ビックデータを活用した機械学習や統計学などの学問が関係しています。
 食品科学科では、2年次対象の「生物統計学(2024年度からは食品データサイエンスに名称変更)」を開講しています。2年次から本格的にスタートする科学系の実習で使う統計量(平均や分散)の考え方や計算方法を解説しています。演習問題やレポート課題を用いて、実際に計算することで知識の定着を促しています。紙とペンを使った手計算でも対応はできますが、たくさんのデータを取り扱う際にはExcelの利用が推奨されます。講義内では、Excel関数の使い方や注意点をデモンストレーション形式で説明して、一部のエクセルデータは受講生に配布しています。ご存じの方もいるかと思いますが、Excel(2016以降)に、3Dマップと呼ばれる地図上にグラフを重ね合わせる機能があります。講義では、本学の最寄り駅「武蔵境駅」までの鉄道運賃を題材に、3Dマップ作成を説明しました。下図は埼玉県、神奈川県、千葉県、東京都の各駅(約1500駅)に、運賃価格を四角柱の相対的な高さで示しています。

 食品科学関連においても、地理情報と結び付けられるデータ(食材の収量、店舗売上など)はたくさんあるので、色々な分野で活用できます。
 また、食品に関する実際のデータを活用した授業も行っています。一例として、加工食品の市場調査データやPOSデータ(*1)を紹介しました。これらデータの入手方法(公立図書館等)も説明しました。時系列データの解説には、本学生協の飲料売上データ(下図)を利用しました。

 私たちが入手している統計データのほとんどは、データ整理や統計量計算が完了しており、綺麗なグラフや表として提供されています。授業では、飲料販売のオリジナルデータ(生データ)から、表形式の変更やラベル付与などのデータ加工、時系列データの作成を解説しました。近年は、統計解析ソフトウェアが高機能化しているので、データのかたまりを入力すれば、ソフトが良い感じに要約してくれると思われがちですが、目的に応じて適切な統計手法やグラフを選択する必要があります。統計学の教育は、他の講義や実習でも行われており、様々な事例と対応する統計学を学ぶことで、データサイエンスへの理解を深めていきます。

 8月の19日と20日には、本学全体(食品科学科、動物科学科、獣医学科、獣医保健看護学科)のオープンキャンパスがあります。大学の中身や大学生活をイメージできるようなイベントを企画しています。本学の受験生サイト食品科学科の公式インスタグラムで詳細をお知らせする予定です。

*1)POSデータ:どのような商品がいつ売れたのかという情報を、POSレジで取得したデータのことを指します。お店のPOSレジで商品のバーコードを読み取るなどして得られるデータをシステムに取り込むことで、リアルタイムでのデータ管理ができます。これらデータが、お店の在庫管理や消費者の購買行動の把握に活用されています。