英国威廉希尔公司,十大博彩公司

情報検索の基礎

参加者

久保侑哉
小池佳輝
坂本崚太郎
髙木　涼太
小林　和央
奈須　日向太
野﨑　崇弘
1　論理検索 (17) [野崎]
1.1　情報検索問題の例
1.2　逆インデックス構築の最初の試み
1.3　論理クエリーの処理
1.4　拡張された論理モデル対ランク付けされた検索
1.5　引用文献と参考図書

2　用語語彙とポスティングリスト (25) [小林]
2.1　文書輪郭と文字列解読
2.2　用語の語彙を決定する
2.3　スキップポインターによる高速なポスティングリストの共通集合操作
2.4　位置ポスティングとフレーズクエリー
2.5　引用文献と参考図書

3　辞書と融通のきく検索 (16) [奈須]
3.1　辞書検索の構成
3.2　ワイルドカードクエリー
3.3　スペル修正
3.4　音声上の修正
3.5　引用文献と参考図書

4　インデックスの構築 (18) [高木]
4.1　ハードウェア概説
4.2　ブロックソートインデックス
4.3　シングルパスインメモリーインデックス
4.4　分散インデックス
4.5　動的インデックス
4.6　他のタイプのインデックスについて
4.7　引用文献と参考図書

5　インデックスの圧縮 (21) [小池]
5.1　検索システムにおける用語の統計的性格
5.2　辞書の圧縮
5.3　ポスティングファイルの圧縮
5.4　引用文献と参考図書

6　スコア付け，用語重み付け，ベクトル空間モデル (22) [野崎]
6.1　パラメーターおよびゾーンインデックス
6.2　用語頻度と重み付け
6.3　スコア付けのベクトル空間モデル
6.4　改良型tf-idf関数
6.5　引用文献と参考図書

7　検索システム全体のスコア計算 (14) [坂本]
7.1　効果的なスコア付けとランキング
7.2　情報検索システムのコンポーネント
7.3　ベクトル空間スコア付けとクエリー演算子の相互作用
7.4　引用文献と参考図書

8　情報検索の評価 (23) [奈須]
8.1　情報検索システムの評価
8.2　一般的に使われているテストコレクション
8.3　ランクなし検索集合の評価
8.4　ランク付き検索結果の評価
8.5　関連性の評価
8.6　さらに広い観点から：システムの質とユーザーの実用性
8.7　検索結果のスニペット
8.8　引用文献と参考図書

9　適合フィードバックとクエリー拡張 (16) [高木]
9.1　適合フィードバックと疑似適合フィードバック
9.2　クエリー改良のためのグローバルな手法
9.3　引用文献と参考図書

10　XML検索 (22) [坂本]
10.1　基本的なXML概念
10.2　XML検索の課題
10.3　XML検索のベクトル空間モデル
10.4　XML検索の評価
10.5　テキスト中心のXML検索対データ中心のXML検索
10.6　引用文献と参考図書

11　確率的情報検索 (16) [上野]
11.1　基本的な確率論の復習
11.2　確率ランキング原理
11.3　バイナリー独立モデル
11.4　評価といくらかの拡張
11.5　引用文献と参考図書

12　情報検索のための言語モデル (15) [久保]
12.1　言語モデル
12.2　クエリー尤度モデル
12.3　情報検索における言語モデル手法と他の手法との対比
12.4　拡張言語モデル手法
12.5　引用文献と参考図書

13　テキストの分類とナイーブベイズ (32)
13.1　テキスト分類問題
13.2　ナイーブベイズテキスト分類
13.3　ベルヌーイモデル
13.4　ナイーブベイズの性質
13.5　特徴選択
13.6　テキスト分類の評価
13.7　引用文献と参考図書

14　ベクトル空間分類 (27)
14.1　文書の表現とベクトル空間での関係性の指標
14.2　ロッキオ分類
14.3　k最近傍法
14.4　線形分類器対非線形分類器
14.5　クラス数が2より多い分類
14.6　バイアス-バリアンス?トレードオフ
14.7　引用文献と参考図書

15　サポートベクターマシンと文書の機械学習 (25)
15.1　サポートベクターマシン―線形分離可能な場合
15.2　サポートベクターモデルへの拡張
15.3　テキスト文書の分類における問題
15.4　アドホック情報検索での機械学習手法
15.5　引用文献と参考図書

16　フラットクラスタリング (24)
16.1　情報検索でのクラスタリング
16.2　問題設定
16.3　クラスタリングの評価
16.4　K平均法
16.5　モデルに基づいたクラスタリング
16.6　引用文献と参考図書

17　階層的クラスタリング (22)
17.1　階層的凝集クラスタリング
17.2　単一リンククラスタリングと完全リンククラスタリング
17.3　グループ平均凝集クラスタリング
17.4　重心クラスタリング
17.5　階層的凝集クラスタリングの最適性
17.6　分割可能クラスタリング
17.7　クラスターラベル付け
17.8　実装上の注意
17.9　引用文献と参考図書

18　行列の分解と潜在意味インデックス (15)
18.1　線形代数の復習
18.2　用語文書行列と特異値分解
18.3　低階数近似
18.4　潜在意味インデックス
18.5　引用文献と参考図書

19　ウェブ検索の基礎 (21)
19.1　背景と歴史
19.2　ウェブの特徴
19.3　経済モデルとしての宣伝
19.4　検索のユーザーエクスペリエンス
19.5　インデックスのサイズと推定
19.6　ほぼ複製とシングリング
19.7　引用文献と参考図書

20　ウェブのクローリングとインデックス付け (16)
20.1　概説
20.2　クローリング
20.3　インデックスを分散化する
20.4　接続サーバー
20.5　引用文献と参考図書

21　リンク解析 (21)
21.1　グラフとしてのウェブの世界
21.2　PageRank
21.3　ハブと権威者
21.4　引用文献と参考図書
スケジュール（予定）

参考資料

「情報検索の基礎」（共立出版）
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze: Introduction to Information Retrieval, Cambridge University Press, 2008.（原著）…PDF版が入手可能
Stanford大の講義（資料あり）
風間一洋
英国威廉希尔公司,十大博彩公司

情報検索の基礎

参加者

目次

スケジュール（予定）

参考資料