セミナー

鹿島研究室では、機械学習・データマイニング・人工知能分野を中心に様々な分野で活躍されている方々に講演いただく公開セミナーを開催しています。

今後の公開セミナー情報

2016/10/01: KDD2016 勉強会

日時・場所 : 2016/10/1(土) 10:30- 於 総合研究7号館4階 435号室
概要:データマイニング分野の国際会議KDD2016の会議参加報告・論文紹介ならびに今後の研究へ向けたディスカッションを行います。
KDD2016 勉強会


2016/6/29: 情報処理の医療応用の可能性

講演者: 荒牧 英治 氏(奈良先端科学技術大学院大学)
日時・場所: 2016/6/29(水) 13:30-14:30 於 京都大学 吉田キャンパス 総合研究7号館 講義室3
概要: ビッグデータ,人工知能,ディープラーニング,さまざまな情報技術の波が医療を革新しつつある.新しい技術によって,どのようなことが可能になりつつあるのか,言語処理技術を中心に,認知症,感染症,副作用といった医療応用事例を紹介する.

講演者プロフィール: 2000年京都大学総合人間学部卒業.2002年京都大学大学院情報学研究科修士課程修了.2005年東京大学大学院情報理工系研究科博士課程修了.博士(情報理工学). 2005年東京大学医学部附属病院特任助教,2008年東京大学知の構造化センター特任講師,2011年京都大学デザイン学ユニット特定准教授を経て,奈良先端科学技術大学院大学特任准教授.医療情報学,自然言語処理の研究に従事.


過去の公開セミナー情報

2016/3/14: ビッグデータ時代の機械学習

講演者: 山田 誠 氏(京都大学)
日時・場所: 2016/3/14(月) 13:30-14:30 於 京都大学 吉田キャンパス 総合研究7号館 講義室1
概要: Yahoo, グーグル, Facebook, Amazon等のIT企業においては, 数千万〜数億ユーザーに対して記事推薦, E-mailの スパム検出, 商品の推薦, 友達推薦 等のサービスを提供していることから, 超大規模データ(ビッグデータ)を自動的にかつ効率よく解析する必要がある. そのため, IT企業においては, 2000年代初頭から盛んに大規模分散処理に基づく機械学習手法が利用されてきた. 近年では, IT企業以外の民間企業や大学においても, スマートフォン等のセンサーを搭載したモバイル端末の普及や計測機器の高度化により, 膨大な量 のデータが利用可能となり, 大規模分散処理や大規模データを効率よく扱う機 械学習手法が用いられ始めている. そのため, 予測精度が高いだけではなくデータに対してスケールする機械学習手法の開発が, より良いサービスを提供することや新しい科学的発見をサポートすることにおいて, 非常に重要となっている. 本講演では, 機械学習技術がIT企業においてどのようにビッグデータ に応用されているかを解説し, 次いで, Yahoo Labsおよび京都大学で研究開発を進めている超高次元特徴選択や推薦アルゴリズムについて紹介する.


2016/3/14: 劣モジュラ関数を用いた機械学習に関する最近の話題

講演者: 河原 吉伸 氏(大阪大学)
日時・場所: 2016/3/14(月) 14:45-15:45 於 京都大学 吉田キャンパス 総合研究7号館 講義室1
概要: 劣モジュラ関数は,集合関数における凸関数に相当する関数で,最適化を考えたときの性質の良さと,応用を考えたときの表現力をあわせもった関数であることが知られている.近年では,機械学習をはじめとした広い数理・応用分野でその有用性が認識され議論されるようになっている.本発表では,まず劣モジュラ関数とそれに伴う基礎事項,及び機械学習に必要となる最適化アルゴリズムの導入的事項を説明する.その上で,劣モジュラ関数の性質を利用した機械学習における最近の研究について概観する.特に,機械学習における劣モジュラ最適化の火付け役ともなった劣モジュラ関数最大化の機械学習への応用や,ネットワークフロー最適化として帰着可能な構造正則化学習など,ある程度大きな問題サイズでも適用できる(実用的な)アプローチを中心に,具体的な適用例を見ながら話を進める.また特に最近の話題として,劣モジュラ関数を用いた確率分布による構造的学習に関連したアプローチについてもふれる.


2016/1/7: クラウドソーシング・コンピュータビジョン・ストリートビューを用いた歩道のアクセシビリティデータの収集手法

講演者: 原 航太郎 氏(University of Maryland, College Park)
日時・場所: 2016/1/7(木) 16:00-17:30 於 京都大学 吉田キャンパス 総合研究8号館 講義室1
概要: 歩道と車道の間のスロープ(縁石ランプ)の欠如など、整備の行き届いていない劣悪な歩道環境は歩行障害がある方の生活に支障をきたします。アメリカでは歩道などの公共の場が全ての人にとってアクセシブル(バリアフリー)であるよう法令(*)で義務付けられているにもかかわらず、多くの地域で問題が改善されないまま残されています。アクセシビリティはインフラの問題である一方、どの歩道がアクセシブルかといった情報の欠如、またその情報を集める効率的なメカニズムがないことも問題とされています。本セミナーではこの情報の欠如を解決する手法として、クラウドソーシング・コンピュータビジョン・ストリートビューを用いた情報を収集する手法を紹介させていただきます。

(*)Americans with Disability Act。日本ではバリアフリー法により、公共交通施設や建築物のバリアフリー化、または基準適合努力が義務付けられています。

発表資料:http://www.slideshare.net/kotarohara/using-crowdsourcing-automated-methods-and-google-street-view-to-collect-sidewalk-accessibility-data


2015/12/28: 高階結合正則化と機械学習諸問題への応用

講演者: 竹内 孝 氏(NTTコミュニケーション科学基礎研究所)
日時・場所: 2015/12/28(月) 16:00-17:00 於 京都大学 吉田キャンパス 総合研究7号館 講義室1
概要: 機械学習の問題では、特徴量のグループ(例えば、同じ意味を持つ単語、同じジャンルの音楽など)が事前知識として得られる場合がある。ある問題において、グループに属する特徴量が同じ働きをするならば、これらの特徴量のパラメタは同一の真値を持つと仮定できる。しかし、既存の正則化(Fused LASSOやGroup LASSO等)では前述の仮定を表現できない。

本講演では、構造正則化の1つとして、特徴量のグループをハイパーグラフとして利用しパラメタの推定量を平滑化する高階結合正則化、および高階結合正則化項の劣モジュラ性を利用し正則化項を最小化するO(nlogn)の近接法を提案する。数値実験として、線形回帰問題に提案法と既存の正則化を適応した場合の汎化性能比較結果を示す。また、最新の研究トピックとして、マルチタスクラーニングへの構造正則化の応用や、時空間データ解析における低ランクなテンソル補完問題への構造正則化の導入、平均近接法を用いた非負行列因子分解法などを紹介する。


2015/10/16: 競技データマイニングにおけるテクニックと動向

講演者: 小嵜 耕平 氏(AIGジャパン・ホールディングス株式会社)
日時・場所: 2015/10/16(金) 14:00-15:30 於 京都大学 吉田キャンパス 総合研究7号館 講義室1
概要: 予測モデルや最適化手法を競い合うコンテストは古くから様々な場で開催されてきました。近年ではデータサイエンスをクラウドソーシングする場として Kaggle をはじめとしたプラットフォームが登場し、賞金付きのコンテストが活発に行われています。本講演では競技としてのデータマイニングのコンテストについて解説し、講演者の KDD Cup 2015 での優勝の経緯、コンテストで用いられるテクニックや優勝者の解法について紹介します。
発表資料:https://speakerdeck.com/smly/techniques-tricks-for-data-mining-competitions


2015/8/29: データマイニング検討会(KDD 2015)

日時・場所 : 2015/8/29(土) 10:30-18:30 於 総合研究7号館4階 435号室
概要:データマイニング分野の国際会議KDD2015の会議参加報告・論文紹介ならびに今後の研究へ向けたディスカッションを行います。
データマイニング検討会(KDD 2015)


2015/7/22: ベイズ的最適化(Bayesian Optimization)の基礎と応用

講演者: 佐藤 一誠 氏(東京大学)
日時・場所 : 2015/7/22(水) 13:00-14:30 於 京都大学 吉田キャンパス 総合研究7号館 講義室2
概要: ベイズ的最適化とは、入力から出力を得るコストが高いブラックボックス関数を効率的に最適化する手法の総称である。高コストなブラックボックス関数に対し て、少ない入力のステップでより最適化な出力を得ることを目的とする。例えば化学実験において、ある実験設定を入力として、得られた化合物の良し悪しが数 値的に計測可能な場合に、より良い実験設定を探索する問題は、ベイズ的最適化の1つの応用例となる。
近年、機械学習アルゴリズムの複雑化にともない、機械学習アルゴリズムの実験設定も複雑化しており、ベイズ的最適化によって機械学習の実験を効率化する 研究が注目を集めている。例えば、word2vecに代表される単語のベクトル表現学習では、ベクトルの次元、窓幅、負例サンプリング分布のパラメータ、 負例数、学習率などさまざまな実験設定があり、これらの効果的な実験設定を効率的に探索する必要がある。
本講演では、ベイズ的最適化の基礎事項としてガウス過程の基礎から説明を行い、ベイズ的最適化の入門から応用まで説明する。


2015/7/17: データを価値化する解析プロセスの俯瞰と効率化

講演者: 近藤 康一朗氏(株式会社 電通)
日時・場所 : 2015/7/17(金) 14:00-15:30 於 京都大学 吉田キャンパス 総合研究7号館 講義室1
概要: データ収集、集計、解析、レポーティング/コンサルティングなど、データを価値化するプロセスを具体的なケース事例と共に紹介します。各プロセスにおける 初心者向けの学習方法、先端技術、効率化の手段をご紹介します。また、講演者の実業務をもとにマーケティング業界におけるデータ・サイエンティストのキャ リアについても解説を行います。
発表資料:http://www.slideshare.net/koichirokondo/ss-50652353


2015/3/16: 自然言語処理におけるディープラーニングの発展

講演者:坪井 祐太 氏 (日本IBM東京基礎研究所)
日時・場所 : 2015/3/16(月) 16:00-17:00 於 京都大学 吉田キャンパス 総合研究7号館 講義室1
概要:
自然言語処理でもディープラーニングが盛り上がり始めています。
画像・音声処理と自然言語処理の違いや、最近進展のあったRNNに基づく手法など
最先端の手法をご紹介します。[発表資料]

参考文献:
坪井 祐太, 自然言語処理におけるディープラーニングの発展, オペレーション
ズ・リサーチ, Vol.60, No.4 (In press)


2015/1/20: 能動学習による多関係データセットの構築

講演者:梶野 洸 氏 (東京大学大学院情報理工学系研究科数理情報学専攻)
日時・場所 : 2015/1/20(火) 15:00~16:00 於 京都大学 吉田キャンパス 総合研究7号館 情報3講義室 (1階 104)
概要:
セマンティックウェブ、知識ベースなど、様々なデータは、二主体間の複数種類の有向関係で記述できる。これを多関係データと呼ぶ。ウェブや科学論文から多関係データセットを自動抽出する研究が多く行われているが、常識的な知識などが抽出できないという欠点がある。本講演では、能動的に人に関係の有無を尋ねる能動学習を用いて多関係データセットを構築する手法を提案する。実データを用いた実験により手法の有効性を確認する。
発表資料:能動学習による多関係データセットの構築 – slideshare


2014/11/28: テンソル分解を用いた大規模実データからの異常検知の試み

講演者:丸橋弘治 氏 (株式会社富士通研究所 ナレッジプラットフォーム研究部)
日時・場所 : 2014/11/28(金) 14:45~16:00(質疑応答込み) 於 京都大学 吉田キャンパス 総合研究7号館セミナー室2
概要:
近年、社会のあらゆる場所で蓄積されたデータを、ビジネスなどの実問題に活用する動きが活発になっている。特に、ネットワーク通信ログやWebアクセスログ、POSデータといった、多数の人や機器の挙動を記録したデータから、不正行為などの特殊な意図に基づく挙動を発見することが、セキュリティやマーケティングなどの分野で求められている。これは、人や機器などの要素に対し、大量の要素間関係の集合の中から、特徴的な要素間関係のパタンを見つけ出すことに相当する。現状のネットワーク侵入検知などでは、注目すべき要素間関係のパタンをルールとして予め記述しておき、ルールに合致するパタンを検知する。しかし、このような方法では、新手の攻撃パタンなど、想定の範疇を超えたパタンを見つけることができない。この問題に対する一つの有効なアプローチは、データ全体における要素間関係の主要な分布をモデル化した上で、主要な分布と比較して特徴的な分布を示す要素間関係の集合を検知するアプローチである。本セミナーでは、要素間関係を表すデータをテンソルとみなし、テンソル分解を用いて主要な分布をモデル化することにより、特徴的な要素間関係のパタンを検知する、いくつかの事例を紹介する。


2014/9/23: ACM SIGKDD2014 論文読み会

日時・場所 : 2014/9/23(火) 13:00-20:30 於 総合研究7号館4階 435号室
概要:データマイニング分野のトップ国際会議KDDの論文を紹介します。
KDD2014論文読み会 (関西会場)


2014/4/22: クラウドソーシングを支える品質管理手法

講演者: 馬場 雪乃(国立情報学研究所 ビッグデータ数理国際研究センター/JST ERATO 河原林巨大グラフプロジェクト 特任助教)
日時・場所 : 2014/4/22(火) 16:30-18:00 於 総合研究7号館1階 情報3講義室
概要:
不特定多数の人々にインターネットを介して仕事を発注する仕組み「クラウドソーシング」の利用が様々な業種で拡大している。
情報科学の研究においても、データ収集や評価実験など人間の力が必要となる場面でクラウドソーシングが広く使われるようになり、クラウドソーシングは研究遂行上必要不可欠なツールになりつつある。
さらに、クラウドソーシングをより良い仕組みにするための研究が、人工知能やヒューマンコンピュータインタラクションの分野を中心として行われている。
本講演では、特に研究で用いるツールとしてのクラウドソーシングの有用性を紹介した後、クラウドソーシングを支える技術として期待される品質管理の研究について解説する。


2014/4/21: 構造データに対するカーネル法と簡潔データ構造

講演者: 木村 大翼 (東京大学 大学院情報理工学系研究科 数理情報学専攻 博士課程)
日時・場所 : 2014/4/21(月) 13:30-15:00 於 総合研究7号館1階 セミナー室1
概要:
近年、文字列、木構造、グラフ構造など非ベクトル型データとして表現される構造データに対する学習の重要性は年々増加している。
このような構造データに対する強力な学習手法の一つとしてカーネル法があり、代表的な学習器としてサポートベクトルマシン(SVM)がある。
しかし、一般にカーネル関数を用いたSVM学習の計算量は入力のデータ数nについてO(n^2)であり、大規模データに対する学習は困難である。
また一方で簡潔データ構造と呼ばれるデータ構造が注目されている。
簡潔データ構造とはデータの大きさが情報論的下限と呼ばれる非常に小さい大きさに漸近し、かつ高速な演算を可能とするデータ構造であり、ビット列、文字列、木構造、グラフ構造など様々な離散構造に対し提案されている。

本講演ではまず構造データに対するカーネル法の枠組みを述べ、特に木カーネルをいくつか紹介し、カーネル法の計算量的問題点に触れる。
その後簡潔データ構造の枠組みを述べ、ビット列、文字列、木構造に対する簡潔データ構造を紹介する。
最後に構造データに対するカーネル法の計算量的問題が簡潔データ構造によって解決されることを述べ、簡潔データ構造を利用した木カーネルの高速なSVMの学習アルゴリズムを紹介する。提案アルゴリズムの時間計算量はデータ数nについてO(n)であり、なおかつ空間計算量はラベル付き木の情報論的下限に漸近する。