インテリジェントウェブアルゴリズム

 

ビッグデータ活用の第一歩。大量に蓄積されたデータを駆使してアプリケーションをインテリジェント化する。プログラマがデータサイエンティストとして飛躍するための一冊。レコメンデーション、クラスタリング、分類を、コードを書いて原理から理解する。

著者:Haralambos Marmanis、Dmitry Babenko
訳者:伊東直子真鍋加奈子堀内孝彦
価格:本体3,800円、税込3,990円発行:みかん書院
発売:星雲社
発行日:2012年10月31日
ページ数:368ページ
寸法:182 x 233 x 19
ISBN:978-4-434-17203-8
Cコード:C3055

目次

序文
謝辞
本書について
第1章 インテリジェントウェブとは
1.1 インテリジェントWebアプリケーションの例
1.2 インテリジェントアプリケーションの基本要素
1.3 アプリケーションはインテリジェンスから何を得るのか
1.4 アプリケーションにインテリジェンスをもたせるには?
1.5 機械学習、データマイニング、そしてそのすべて
1.6 インテリジェントアプリケーションの8つの誤解
1.7 まとめ

第2章 検索 サンプル公開中

2.1 Lucene による検索
2.2 インデックスを超える高度な検索
2.3 リンク解析に基づいて検索結果を改善する
2.4 ユーザクリックに基づいて検索結果を改善する
2.5 Word、PDF、その他のリンクを持たないドキュメントをランク付けする
2.6 大規模実装時の問題
2.7 得られた結果は欲しい結果? 精度と再現率
2.8 まとめ
2.9 TODO

第3章 レコメンデーションを生成する
3.1 オンラインミュージックストアの基本概念
3.2 レコメンデーションエンジンはどのように機能するのか?
3.3 友人、記事、ニュースをレコメンドする
3.4 サイトで映画をレコメンドする - Netflix.com
3.5 大規模な実装と評価に関する問題点
3.6 まとめ
3.7 TODO

第4 章クラスタリング:物事をグループに分ける
4.1 クラスタリングの必要性
4.2 クラスタリングアルゴリズムの概要
4.3 リンクベースのアルゴリズム
4.4 k平均法アルゴリズム
4.5 リンクを用いたロバストなクラスタリング(ROCK)
4.6 DBSCAN
4.7 超大規模データにおけるクラスタリングの問題
4.8 まとめ
4.9 TODO

第5章 分類:物事をあるべき場所に収める
5.1 分類の必要性
5.2 分類器の概要
5.3 メールの自動分類と迷惑メールのフィルタリング
5.4 ニューラルネットワークを用いた不正検出
5.5 その結果は信頼できるか?
5.6 大規模なデータセットの分類
5.7 まとめ
5.8 TODO

第6章 分類器を組み合わせる
6.1 信用度:分類器の組み合わせのケーススタディ
6.2 単一分類器での信用評価
6.3 同じデータを用いて複数の分類器を比較する
6.4 バギング(Bagging):bootstrap aggregating
6.5 ブースティング(Boosting):繰り返し改善アプローチ
6.6 まとめ
6.7 TODO

第7章 すべてを組み合わせる:インテリジェントニュースポータル
7.1 機能の概要
7.2 コンテンツの取得とクレンジング
7.3 ニュース記事の検索
7.4 ニュースカテゴリの割り当て
7.5 NewsProcessorクラスを使ってニュースグループを構築する
7.6 ユーザのレイティングに基づく動的コンテンツ
7.7 まとめ
7.8 TODO

付録A BeanShell の紹介
A.1 BeanShell とは?
A.2 なぜ BeanShell を利用するのか ?
A.3 BeanShell の実行

付録B Web クローリング
B.1 クローラのコンポーネントの概要

付録C 数学の復習
C.1 ベクトルと行列
C.2 距離の測定
C.3 高度な行列法

付録D 自然言語処理

付録E ニューラルネットワーク

参考文献

Comments are currently closed.