和歌山大学では、令和2年度より、全学部1年生を対象とした、リテラシーレベルの数理?データサイエンス?AI教育プログラム「データサイエンスへの誘い」を実施しています。
また、本プログラムは、文部科学省「数理?データサイエンス?AI教育プログラム認定制度 リテラシーレベル(プラス)」に認定されています(認定の有効期限:令和8年3月31日まで)。
本教育プログラムを通じて身につけることができる能力
統計の基本的内容、統計の正しい見方、統計学からデータサイエンスにつながる内容、世の中の活用事例などについて理解し、データサイエ ンスの基本的な手法の概要や特徴に加え、データサイエンスが社会でどのように活用されているか、データサイエンスの必要性を説明でき、さ らに、その応用事例を説明できる。また、Excelを用いた統計処理の方法、図表の作成などの初歩的なデータの加工、作成方法などを行うこと ができ、データの分析結果の基本的な解釈を行えるだけでなく、コンピュータを用いた分析方法の特徴についても説明できる。
教育改善?質保証(自己点検?評価)
- 2020年度 データサイエンスへの誘いA/Bアンケートの集計結果と今後の対応
- 2021年度 データサイエンスへの誘いA/Bアンケートの集計結果と今後の対応
- 2022年度 データサイエンスへの誘いA/Bアンケートの集計結果と今後の対応
- 2023年度 データサイエンスへの誘いA/Bアンケートの集計結果と今後の対応
実施体制
委員会等 | 役割 |
---|---|
データ?インテリジェンス教育研究部門長 | プログラムの運営責任者 |
データ?インテリジェンス教育研究部門教育カリキュラム検討部会 | プログラムの改善?進化 |
データ?インテリジェンス教育研究部門業務部会 | プログラムの自己点検?評価 |
実施科目と学習内容
- 本プログラムの修了要件:「データサイエンスへの誘いA」(1単位)及び「データサイエンスへの誘いB」(1単位)の計2単位取得すること。
実施科目 | 学習内容 |
---|---|
データサイエンスへの誘いA | 統計の基本的内容、統計の正しい見方、統計学からデータサイエンスにつながる内容、世の中の活用事例など、データ利活用の重要性を理解し、Excelを用いた基本的なデータ操作の方法(統計処理の方法、図表の作成、データの加工、作成方法、解釈方法など)を習得する。 |
データサイエンスへの誘いB | データサイエンスの基本的な手法の概要、コンピュータ(R、Python)を用いた分析方法の特徴の概要、応用事例を知り、データサイエンスの必要性を理解すること。 |
モデルカリキュラムとの対応
本プログラムを構成する授業の内容?概要(数理?データサイエンス?AI(リテラシーレベル)モデルカリキュラムの「導入」、「基礎」、「心得」に相当)は下記の通りです。
授業に含まれている内容?要素 | 授業概要 | 授業科目名 |
---|---|---|
(1)現在進行中の社会変化(第4次産業革命、Society 5.0、データ駆動型社会等)に深く寄与しているものであり、それが自らの生活と密接に結びついている ※モデルカリキュラム導入1-1、導入1-6が該当 |
ビッグデータ時代の幕開け、スマートフォンの登場、無線通信の速度とデータ容量の増加、IoTの急速な拡大など、社会で起きている大きな変化について講義を行う。具体的には、商品のレコメンデーションなど普段よくみるサービスがデータにより実現されていることを説明する。また、データは、21世紀の石油と呼ばれ、GAFAといったプラットフォーマーや中国の企業(BAT)について講義する。和歌山県統計データ利活用センターの協力を得て、公的統計に関して、その重要性、公的統計からわかる身近な内容や意外な内容、公的統計の使い方などについて講義する。 | データサイエンスへの誘いA/B |
(2)「社会で活用されているデータ」や「データの活用領域」は非常に広範囲であって、日常生活や社会の課題を解決する有用なツールになり得るもの ※モデルカリキュラム導入1-2、導入1-3が該当 |
現在、ポイントカードやSNSなどを用いた人の行動ログデータの収集、様々な形でデータ収集が行われており、データ駆動型社会が、生活に深く関わっていることを講義する。その他に、GPS(GNSS)による位置情報の収集、IoT(Internet of Things)、科学分野における大量のデータ収集なども紹介する。現代のそろばんとしてのデータサイエンスについて説明し、データサイエンティストの重要性やデータサイエンティストが求められている点についても講義する。また、データのオープン化の説明を行い、具体例として、e-Stat(イースタット、政府統計の窓口)、RESAS(リーサス、地域経済分析システム)、DATAGO.JP(データカタログサイト)、企業提供のデータ、気象庁提供のデータを紹介する。また、EBPM(Evidence-Based Policy Making、証拠に基づく政策立案)を紹介し、仮説検証、知識発見、原因究明、計画策定への活用について講義する。 |
データサイエンスへの誘いA/B |
(3)様々なデータ利活用の現場におけるデータ利活用事例が示され、様々な適用領域(流通、製造、金融、サービス、インフラ、公共、ヘルスケア等)の知見と組み合わせることで価値を創出するもの ※モデルカリキュラム導入1-4、導入1-5が該当 |
様々なデータ利活用の現場におけるデータ利活用事例としは、マーケティングでは、スーパーマーケットにおけるポイントカード、POSデータ、クレジットカードの購買履歴などのデータを組み合わせることで、自社商品やサービスの販売する方法、顧客のセグメンテーション、A/Bテストや推薦システムについて講義する。その他、金融、品質管理、画像処理、音声処理、医学、公共におけるAIの活用事例を紹介する。データ解析演習として、予測の例をエクセルを用いて回帰直線を作成し、関係性の可視化を行う。 | データサイエンスへの誘いA/B |
(4)活用に当たっての様々な留意事項(ELSI、個人情報、データ倫理、AI社会原則等)を考慮し、情報セキュリティや情報漏洩等、データを守る上での留意事項への理解をする ※モデルカリキュラム心得3-1、心得3-2が該当 |
データ?AIを扱う上での留意事項として、データ流出事故(個人情報が流出事件)を紹介し、情報セキュリティや情報の漏洩の問題、データバイアスの混入により実験結果の解釈のゆがみについて講義する。また、様々なグラフや統計データの見方、解釈について講義を行う。公的データの守秘義務の話やデータを守るための仕組みについて紹介する。 | データサイエンスへの誘いA/B |
(5)実データ?実課題(学術データ等を含む)を用いた演習など、社会での実例を題材として、「データを読む、説明する、扱う」といった数理?データサイエンス?AIの基本的な活用法に関するもの ※モデルカリキュラム基礎2-1、基礎2-2、基礎2-3が該当 |
データの分析の基礎として、データの種類(量的変数、質的変数)を説明し、ヒストグラム、箱ひげ図、平均値と中央値、最頻値、分散、標準偏差、散布図と相関係数、回帰直線、クロス集計、回帰分析について講義し、データの読み方やデータ説明について学ぶ。さらに、データサイエンス?AIの手法として、ベイズ推論、アソシエーション分析、クラスタリング、決定木、ニューラル、機械学習について講義する。エクセルを用いたデータ取り扱いとして、e-Statから取得した国勢調査を用いたデータや気象庁から取得した気温のデータを可視化(ヒストグラム、箱ひげ図、散布図等)し、その解釈を行う演習を行う。実データとして、住みたい都道府県ランキング、コンビニの数、検挙件数、小中高大の件数、病院数、警察職員数など様々なデータを利用し、データの可視化と結果の解釈を行う。その中で、相関と因果、疑似相関についての講義する。さらに、母集団と標本抽出の複数の手法について説明する。誇張表現に惑わされないように、統計情報の正しい理解、表現方法について説明する。同時に不適切なグラフ表現の説明を行う。また、アソシエーション分析では、実データとして、地元の大手スーパーマーケット(株式会社オークワ)のPOSデータの一部を用いて、Excelを用いて分析を行う。クラスタリングでは、実データとして、住みたい都道府県&市区町村ランキングと旅行?観光動向調査、温泉の数などを組み合わせた可視化を行う。 | データサイエンスへの誘いA |
プログラムを構成する授業の内容?概要(数理?データサイエンス?AI(リテラシーレベル)モデルカリキュラムの「選択」に相当)は下記の通りです。
授業に含まれている内容?要素 | 授業科目名称 |
---|---|
統計及び数理基礎 | データサイエンスへの誘いA/B |
アルゴリズム基礎 | データサイエンスへの誘いB |
データ構造とプログラミング基礎 | データサイエンスへの誘いB |
時系列データ解析 | データサイエンスへの誘いA |
データハンドリング | データサイエンスへの誘いA/B |
データ活用実践(教師あり学習) | データサイエンスへの誘いA/B |
参考文献
吉野 孝、西村 竜一、三浦 浩一
「和歌山大学の数理?データサイエンス?AI教育プログラム~実践的教育を軸とした文理隔たりのない体系的な取組み~」
大学教育と情報, 2022年度 No.4(通巻181号), 公益社団法人私立大学情報教育協会, 2023-3.