挟んでポン

図2.png

イナダとブリの間の名前何なんだったっけ?とか,両親をご飯に連れて行きたいので学生が行くAというレストランよりは良くて,かといってあまり高すぎるBほどまでは良くなくてもいいので,そんなレストランを探したいのように,AとBの間に挟まれた何かを検索したいということは無いでしょうか?
本プロジェクトは,こうしたAとBの間に挟まれた何かを探すことを可能にすることを目的としています.

IPA未踏ユース採択プロジェクト

http://hasande.com/

[編集]Member

  • Project Leader: 旭直人
  • Member: 山本岳洋,中村聡史,田中克己

[編集]内容

WS000017.JPG

近年,検索エンジンは必要とする情報を得る上で欠かせないツールとなってきている.検 索エンジンの進歩に伴い,ユーザが明確な検索意図を持っており,的確なクエリを作ること ができれば,ユーザは自分の求める情報へ容易にたどり着くことができるようになった.し かしながら依然として,明確な検索意図を持っているにも関わらず,的確なクエリを思いつ くことができなければ,求める情報へたどり着くことは困難である.このような状況はさま ざま考えられるが,その中でもそもそもクエリをキーワードとして表現することが困難であ るものが存在する.例えば以下のような場合がある.

  • 戦国時代の出来事といえば,“桶狭間の戦い” と “本能寺の変” があった.しかし,その 間に何があったかを思い出すことができない.この2つの出来事の間にあった出来事を 知りたい.
  • 両親を夕食に誘いたい.大学の近くにはたくさん飲食店がある.○○レストランでは安 すぎて両親は満足しないだろう.しかし,××レストランだと高すぎる.前者よりはよ いが,後者よりは安いといったようなレストランを見つけたい.
  • 友達が Java に関する本を 2 冊貸してくれた.1 冊は私にとって簡単すぎたが,もう 1 冊は難しすぎて理解できなかった.この 2 冊の間のレベルの本を探して購入したい.
  • 友達から結婚式の招待状が届いた.参列することを決めたのだが,招待状を受け取って から結婚式に参列するまでに何をすればいいのだろう.
  • クイックソートのプログラムを書いている.最初と最後のコードは何を書けばいいのか 分かるのだが,その間には何を埋めればいいかわからないため調べたい.

これらの状況では,ユーザはすでに分かっている 2 つのもの,出来事,プロセスの間にあた る何かを見つけたいと考えている.このような検索はある種の補完検索と考えられる.しか し,従来の検索エンジンではこうした情報を直接的に得ることは困難である.現在の検索エ ンジンが指定されたキーワードを文書が含むかどうかという基準で結果を返すが,ユーザは 知りたいものの名前をそもそも知らないため,直接その名前を用いてクエリを生成できな い.そのため,ユーザは欲しい情報に直接到達できないことが原因である.このような情報 を得るためにはクエリを工夫したり,似たようなクエリを何度も作り,多くのページを閲覧 する必要がある. そこで本論文では,既知の 2 つのオブジェクトをクエリとして受け取り,ある観点でオブ ジェクトを順序づけた場合に,その 2 つのオブジェクトの間に存在するようなオブジェクト をユーザに提示する検索手法を提案する.ここでいうある観点とは,先の例であれば,時 間,価格,難しさ,順番といったものになる.ユーザが入力した 2 つのオブジェクトの間に 位置する最適なオブジェクトを本論文では “補間オブジェクト” と定義する.

現在では、ユーザが入力した 2 つのオブジェクトと補間オブジェクトについて Web ページで言及する場合,補間オブジェクトはその 2 つのオブジェクトの間に記述するので はないか,という仮定に基づいて語の位置に着目し,候補語の抽出を行う.その後,出現頻 度や出現位置に基づき候補語をランキングし,ユーザに補間オブジェクト候補として提示 する.今後は手法を拡張していく予定である。

seq_image.jpg

間をどんどん挟むことによって、間を埋めていくことができ、系列を生み出すこともできる。

[編集]Publications

国際会議

  • Naoto Asahi, Takehiro Yamamoto, Satoshi Nakamura, Katsumi Tanaka: "Discovering Intermediate Entities from Two Examples by Using Web Search Engine Indices" Proceedings of the 4th International Conference on Ubiquitous Information Management and Communication(ICUIMC2010), (採録済), Jan. 2010.
  • Naoto Asahi, Takehiro Yamamoto, Satoshi Nakamura, Katsumi Tanaka: "Finding Intermediate Entity between Two Examples on the Web" Proceedings of the 11th ACM International Workshop on Web Information and Data Management(WIDM2009),

国内会議(査読あり)

  • 旭 直人, 山本 岳洋,中村 聡史,田中 克己: 挟みこむ検索:Webからの補間オブジェクト発見, 楽天研究開発シンポジウム2009, 2009年11月.

国内会議(査読あり)

  • 旭 直人, 山本 岳洋,中村 聡史,田中 克己: 挟みこむ検索:明示的に与えられた観点に基づく補間エンティティの発見, 情報処理学会創立50周年記念全国大会, 5ZN-5, 2010年3月.
  • 旭 直人, 山本 岳洋,中村 聡史,田中 克己: 挟みこむ検索:2オブジェクトからの補間オブジェクト発見, 第149回データベースシステム研究発表会, 2009年11月.
  • 旭 直人, 山本 岳洋,中村 聡史,田中 克己: 挟みこむ検索:与えられた2オブジェクトの補間オブジェクト発見, 平成21年度 情報処理学会関西支部 支部大会, C-14, 2009年9月.
  • 旭 直人,山本 岳洋,中村 聡史,田中 克己: 行動連鎖を用いた情報検索支援とWeb からの行動連鎖の抽出, 第1回データ工学と情報マネジメントに関するフォーラム(DEIM2009),A7-2,2009年3月

賞罰

  • 情報処理学会第72回全国大会 大会奨励賞
  • 情報処理学会第72回全国大会 学生奨励賞
  • 第149回データベースシステム研究発表会 学生奨励賞
  • 楽天研究開発シンポジウム2009 最優秀論文賞 (旭 直人, 山本 岳洋,中村 聡史,田中 克己: 挟みこむ検索:Webからの補間オブジェクト発見)
  • 平成21年度 情報処理学会関西支部 支部大会 学生奨励賞