検索勉強会に参加したよ

検索勉強会に参加するよ

この会社に入ってからECサイトを担当しているのですが、なんと「検索」をテーマにした草の根の勉強会があったので参加しています。

search-tech.connpass.com

検索は、システムに必須の機能になってきています。 あって当たり前の技術になっていますが、実は結構色々と考えることがあったりします。

検索技術勉強会の目的は、「検索」/「検索システム」にまつわる技術や手法に関して共有できる場を提供することです。 検索エンジンごとの勉強会などもありますが、検索エンジンには関係なく、「検索」というシステム、サービスを作る上で共通の解決すべき課題があります。 これらの課題をみんながどのように解決しているのかといった知識を共有できる場になればと思っています。

 

で、感想なのですがめちゃめちゃ面白いので毎回参加しています。

これまで全回参加できているので、ご紹介...

 

第1回

「いい検索」を考える」 内田さん

どういう感じなんだろうな~と思いながら聞いた思い出...

初心者に優しい感じの基本知識セッションかな、とか思いきや最初だけ。どんどん「奥深いな~~~」となるセッションでした。

2017年入社って、社会人2年目じゃない?すごすぎじゃない?

 

古いですが検索の鉄板本... 大学のときに読んだもの。

情報検索アルゴリズム

情報検索アルゴリズム

 

 こちらは去年読んだ本。これも中々面白いです。

 

情報アクセス評価方法論

情報アクセス評価方法論

 

 

でもこの発表のいいところは、こういう「汎用的な」評価方法にとどまらず「よい検索とは?」を定義しているところでした。すばらしい...

あまりに良い発表だったんで社内で4回くらい人捕まえて聞かせた。

 

UI/UXが無意識に検索行動に与える影響について  Tairo Moriyama さん

メルカリの検索チームすごい話でした。SIG-IRいってるとか尋常じゃない。

評価指標もめちゃ参考になるな~ うちのサイトはどうしたらいいんだろうな~~って考えさせられました。

ちなみに本番の発表では、ある改善が思うように改善しなかった事例を元に、なぜそうなったのか?の「クイズ」的な流れになりました。

20人くらいチャレンジしましたが(私も答えてみましたが)全員はずれ。

もちろんこの流れも社内で再現しました。誰も当たらず。そして答えを言った瞬間の反応も同じ。再現率高すぎる。

 

Efficient top-k query processing in Lucene 8 @moco_betaさん

サービスのレベルの話から、要素技術の話へ。

話の内容の6割くらいついていけてない。

というか、「Luceneの数年オープンになっているチケットを最初から追いかけて流れをつかむ」とか平然と発表されていて、会場が「何者www」という空気でした。

Lucene8ははやいんだなー はー という感想しか残ってない。すごい(語彙)

 

第2回

 もう前回が楽しすぎてテンションがすごかった。でもネタ切れするやろ、と思っていたのが良い意味で裏切られました。深すぎる。

 

「安心な移動」のための POI(Point-of-Interest; 地点) 検索 @lastarrow21 さん

会場ご提供元のNaviplusさんの発表でした。

地点検索とかニッチすぎるな~ ECサイト改善にはあんまり関係ないだろうな~とナメきってました。

  • 経路検索するにも、まず地点の特定ができなければ始まらない、というNaviplusのサービスにとって超重要な要素であること。
  • ECサイトや一般情報検索と違って、検索対象ドキュメントが「地点」という非常に限られた情報量で、的確に検索しなければならないという難しさ。
  • DBにはない「知名度」や、現在地との「距離」などを加味しなければならない地道なデータ構築

めちゃ頭が下がる... 場所の検索といっても考えることが多くてアイディアが広がりますね。

 

社内ドキュメント検索システム構築のノウハウ @shinsuke_sugaya さん

これまでの検索が主にテキストデータをドキュメントとして扱っていた発表だったのですが、それとはまったく軸の異なる課題感がある「社内ドキュメント検索」の話。

  • 種別がたくさん:Word、PDF、画像、Excel一太郎(官公庁とか)、業務システムのDB
  • 権限制御:機密文書、開示範囲...
  • 前処理:そもそも検索対象ドキュメントが一箇所に集まってない。様々な全然違う形式のデータソースから収集する部分も作る必要がある

いままでふわっとしていた、Lucene, Solr/ElasticSearch, GSAなど、同じ検索関連のプロダクトのカテゴライズも整理してくださっていたのでわかりやすかった。

 

料理動画アプリ「クラシル」の検索について @818uuu さん

「検索を好きになったの 小学6年生」

 

やべーやつが来た

 

これはもう、すごすぎて何もいえません。

うちの会社の検索女子にツメの垢を煎じて飲ませたいです(ということでその次の回に検索女子を連れてきました)。

 

第3回

仮)Rettyでお店を探す体験 @R3kei さん

いやー大変だよねー前処理大変だよねー

って思っていたら

なんだかんだ1,2名が片手間でやっている

 うぉぉぉおぉぉっぉぉ

がんばってください。。。

 

ESで類似ベクタサーチをシュッとやる @takahi_i さん

システム要件が出てから手法の良し悪し・手間・めんどくささw を脳内で考えているときってこんな感じだな~~あるな~~と思いながら拝聴。

類似度ベクトル検索って結構カジュアルにできるし需要ある気がするけど、最近は機械学習に負けているのかな。。。

 

 検索の運用って難しいよねって話 @setsuna82001 さん

実は今回この発表が一番楽しみでした。

前回のさくらさんの発表に感化されて、弊社の検索女子(新卒1年目)を連れて行ったのですが、主に同義語辞書などの運用をやっているので、そこに共感... したかった。

 

クラスタ・ノード管理

負荷対応

設定ファイル更新

バージョンアップ

日常の運用

 

あっ、あっ、、、だめだ。。。これはガチのインフラ側の運用や。。。

 

さっぱりわからなかったらしいが、新卒1年目でしたので勉強会自体初めて、ということで、楽しんでいたのでいいでしょう。

そういえば前職では勉強会にいきまくりでした。新卒入社のときに上司が「勉強会で発表しろ」と猛烈にプッシュされていたのを思い出しました。

時間が経ったなぁ。

 

さて来る次回は?

ということで毎回楽しい検索勉強会 #searchtechjp ですが、次回は2019年秋。

明日です!!!!

 

 

 ブログ枠で申し込みしましたので、参加後にレポート書きます。楽しみ。