ツイッターの検索が昨日から日本語にやさしくなくなってしまった話

 Twitter での発言(ツイート;つぶやき)の検索が、昨日から嬉しくない動作に変わってしまったようです。
欲しい情報が、検索にひっかからなくなってしまいました。どうも、今までは部分一致(またはそれに近い状態)でかなり多くのものを検索に引っかけてくれていたのを、「語」を意識した検索に変更されたように見受けられます。


 具体例として、Twitter サイトの検索窓で「おはよう」と入れて検索すると今までは「おはようござる」「おはようございます」「おはようだったり」のようなツイートも検索結果に顕れていたものが、マッチしなくなってしまった、という変更です。 「おはよう」の前後に空白文字や記号があるもののみがマッチしています。
 このことは 「おはよう」の検索結果と「おはようございます」の検索結果を見比べてみれば明らかでしょう。


 この変更が行われたのは、昨日(2010/05/26(水)の日本時間朝8時。キーワードで検索して情報を取得している系のところ(企業の情報収集部門とか)では、結構困っているのではないでしょうか。
 かく言う私も、Twitter上のツイートを拾ってデータマイニングみたいなことをやっていたり、MySQLやコロプラの情報を表示するサイトをやっていたりするので、全然情報が拾えなくなってしょんぼりしています。(MySQLユーザ会のほう http://labo.artry.net/mysweet/ はもともとの検索語がアルファベットなので良いのですが、コロプラのほう http://labo.artry.net/colopleet/ はハッシュタグをつけてくれているもの以外が拾えなくなってしまいました。残念)


 他の方法考えますかね。ストリームからも拾えるのですがそもそもが 5% 程度しか降ってこないということなので本来の検索機能の代替としては弱すぎますし。 
 同様の問題に対してトライしている方、ぜひ情報交換しましょう。


.