授業科目一覧
プログラム
メニューここまで

データの科学('17)

※印刷用にはシラバスPDF版新規ウィンドウ をご利用ください
主任講師
浅井 紀久夫 (放送大学教授)
辰己 丈夫 (放送大学教授)
放送メディア
オンライン
配信期間(2018年度)
第1学期:平成30(2018)年4月5日(木)~8月31日(金)

講義概要

情報通信技術の進展により、膨大な量のデータが交換されるようになりました。データは人間活動に伴う様々なものから日々生産され、インターネットの普及によって瞬く間に世界中に拡散し、互いの関係が極めて複雑になっています。その関係を抽出して有用な知識を得ようと、様々な取り組みが行われるようになりました。本科目では、データ分析処理に必要な基盤技術と基本的な手法について平易に解説します。また、データ科学活用の現状と課題、可能性を示し、データが溢れる時代の暮らしや仕事について考えます。
※詳しくはシラバス

開設年度
2017年度
科目区分
情報学プログラム
科目コード
6970028
単位数
2単位
単位認定試験
試験日・時限
 
単位認定試験
平均点
 
備考
 
このページのトップへ本文ここまで

授業の到達目標

データを扱う技術とその活用方法について理解し、データから所望の情報や法則を抽出する仕組みに関する基礎知識を習得します。収集したデータに対して分析処理を行う際に、採用すべき手法や処理手順を選択できるようになることが一歩進んだ目標です。

成績評価の方法

成績評価は、小テスト(75%)、レポート(25%)の評価により行います。
※オンライン上の学習で評価します。放送授業と異なり、通信指導や学習センターにおける単位認定試験は行いません。また、単位修得できなかった場合の再試験制度もありません。

履修上の留意点

レポートではデータ分析に関する課題がありますので、統計解析ツールRもしくは同等のデータ分析環境が必要です。Rの使用環境を構築する方法およびRの基本的な使い方についてオンライン授業「データの科学」のページに簡単な説明が掲載されています。
※本科目の受講には、インターネットなどの受講環境が必要です。また、パソコンの基本的な操作(インターネット利用を含む)や文書作成などは可能であることを前提にします。詳細は本学ホームページをご参照ください。

シラバス

テーマ 内容 担当講師名
(所属・職名)
1 データからの知識発見 データの生成、蓄積、処理、可視化といったデータ分析処理の一連の流れを示す。データ分析を活用した事例を紹介し、大量のデータを扱う場合の特徴について説明する。

【キーワード】
データの生成、蓄積、処理、可視化、ビッグデータ
浅井 紀久夫
(放送大学教授)
2 センサネットワーク 家電製品や日用品など、ありとあらゆるモノがインターネットにつながり始めた。そうしたモノからデータが収集され、有用なサービスを生み出す材料として使われる。センサネットワークについて説明する。

【キーワード】
データ取得、パーソナルデータ、GIS、Internet of Things
浅井 紀久夫
(放送大学教授)
3 ソーシャルネットワーク インターネット上で人と人とのつながりを促進したり、個人の間のコミュニケーションを支援したりするソーシャルネットワークの仕組みについて説明する。また、人々の利用の仕方やその利用を活用した事例を紹介する。

【キーワード】
SNS、広告、課金
辰己 丈夫
(放送大学教授)
4 クラウドコンピューティング 大量のデータが流通するようになり、その蓄積はデータセンターで行われるようになった。クラウドとそのサービス、これを支える技術について説明する。

【キーワード】
クラウド、PaaS、IaaS、分散並列処理
辰己 丈夫
(放送大学教授)
5 データベース フォームに入力されたような定型データは、リレーショナルデータベースで管理されてきた。しかし、センサからのデータは欠損があるし、ソーシャルネットワークで生成されるデータは雑多で、分類されておらず、フォーマットも様々である。こうしたデータを扱うためのデータベースについて説明する。

【キーワード】
構造化データ、半構造化データ、非構造化データ、リレーショナルデータベース、NOSQL
赤澤 紀子
(電気通信大学講師)
6 データ分析の活用レベル データ分析の活用を、集計による状況把握、傾向や因果関係の発見、予測とシミュレーション、最適化と推薦に類型化し、それぞれについて活用事例を示す。データ分析の活用レベルについて説明する。

【キーワード】
集計、発見、予測、最適化、アソシエーション分析
浅井 紀久夫
(放送大学教授)
7 回帰分析 複数の変量からなるデータがあったとき、特定の変量が他の変量で表すことができれば、予測が可能になる。変量と変量との関係を求める回帰分析について説明する。

【キーワード】
線形回帰、回帰式、最小二乗法、決定係数
浅井 紀久夫
(放送大学教授)
8 主成分分析 複数の変量からなるデータを少数の変量にまとめることができれば、変数間の関係の把握が容易になる。主成分分析について説明する。

【キーワード】
主成分、寄与率、標準化
浅井 紀久夫
(放送大学教授)
9 判別分析 複数の変量からなるデータが幾つかのグループに分割されているとき、変量によってどのグループに属するかわかれば、新たなデータの判別ができる。判別分析について説明する。

【キーワード】
線形判別、マハラノビス距離、分散比
浅井 紀久夫
(放送大学教授)
10 クラスター分析 複数の変量からなるデータが与えられたとき、そのデータをグループに分類できれば、そのグループの特徴を捉えることができる。クラスター分析について説明する。

【キーワード】
階層的分類、非階層的分類、ウォード法、k-平均法
浅井 紀久夫
(放送大学教授)
11 ニューラルネットワーク ニューラルネットワークについて説明する。それを踏まえ、例題と正解が与えられた場合に、それに基づいて学習を行う教師あり学習について説明する。例題をもとに学習することで例題以外の問題にも対応できるようなネットワークを作ることである。学習の手順について説明した後、汎化と過学習について説明する。

【キーワード】
ニューラルネットワーク、教師あり学習、汎化、過学習
秋光 淳生
(放送大学准教授)
12 自己組織化マップ 自己組織化マップとは、教師なし学習の一種で、競合を行い、特定の結合を強化することによって、高次元のデータから、データが本来持っている特徴を抽出した低次元のマップを作成してくれる方法のことである。この手法について説明する。

【キーワード】
教師なし学習、自己組織化マップ、競合
秋光 淳生
(放送大学准教授)
13 評価と仮説 予測を行う場合、分析モデルが未知のデータに対してうまく働くことが重要である。そのため、何らかの基準を設けて、その性能を評価する必要がある。また、膨大なデータが手に入るようになり、仮説の位置付けが変化してきた。評価と仮説について説明する。

【キーワード】
交差確認法、仮説と検証
浅井 紀久夫
(放送大学教授)
14 プライバシーと弊害 便利なサービスと引き替えに、自らの情報を提供しなければいけないことが多い。また、人間の行動の予測精度が格段に上がってきた今、予測される行為で人が判断される可能性も出てきた。プライバシーと負の側面について述べる。

【キーワード】
個人特定、プライバシーへの配慮、個人情報保護法、匿名化、二次利用
辰己 丈夫
(放送大学教授)
15 データ科学の時代 データは爆発的に増加し、これからも増え続けるだろう。そうしたデータを活用することによって、社会の様々な問題を解決しようとする試みが始まっている。データ科学の時代における暮らしや仕事のあり方、考え方など、今後の展望を考察する。

【キーワード】
データ科学、情報爆発、オープンデータ、予測、選択の自由
辰己 丈夫
(放送大学教授)
このページのトップへ本文ここまで
授業科目案内 大学院 放送大学