もっとMroongaを広めるために、みなさんの事例をたくさん紹介したいと思っています!事例のある方はgroonga@groonga.orgにメールするか、GitHubでpull requestを送ってください!
みなさんのサイトでMroongaのロゴを使ってください!
みなさんのノートパソコンにMroongaのステッカーを貼ってください!
電子書籍アラート
Groonga + Mroongaの組み合わせで使用しています。
「電子書籍アラート」はKindleの新刊情報・セール情報をRSSで配信するサービスです。対象書籍は2016年7月時点で約40万件あり、全文検索で絞り込めます。
MroongaのORDER BY LIMIT
最適化を活用しています。ヒット件数が多い時でも高速に結果が返ってくるため助かっています。
開発時にはチャットルームで開発者と相談できて助かりました。
議事ロックス
Groonga + Mroongaの組み合わせで使用しています。
「議事ロックス」は、地方議会の議事録を検索できるサービスです。地方議会の質向上に寄与するために開発されたサービスです。
MariaDBにMroongaがバンドルされているので使ってみたところ、更新スピードもSELECT COUNT
も速かったのでとても便利に使っています。地方議会の議事録データは1件1件がかなりの文章量なのですが、それでも検索に耐えてくれています。
Mroongaは全文検索だけでなく、他のカラムも合わせた検索もできるので、今後も改良を重ねていく予定です。
ちずコレ
Groonga + Mroongaの組み合わせで使用しています。
「ちずコレ」は、マップと中部地域の情報を組み合わせて雑誌感覚で楽しめるスマートフォン向け無料アプリです。さまざまなテーマやストーリーに合わせ、180種類を超えるマップから、自分の欲しいマップをコレクションすることで、あらゆるシーンで活用できます。
検索画面では、「現在地から検索」と「キーワードで検索」の2つの入口から調べることができ、今すぐ知りたい・行きたいというときや、地名・名称などから探したいときに利用いただけます。
「ちずコレ」は"場所を探すための地図ではなく、目的を見つけるための地図を"をコンセプトに、地図の新しい楽しみ方を提案します。
スマートフォンアプリで掲載情報を検索する際、サーバサイドでMroongaを使って全文検索しています。(検索処理専用のMroongaエンジンのテーブルを別途準備、掲載情報メンテナンスの際はトリガーで同期)
検索結果は、スマートフォンの位置(GPSによる)に近い情報順とすることで、より近くにある、ユーザが必要としている情報を提供しています。今後の情報量次第で、位置情報の処理もMroongaエンジンに移行することを検討しています。
スマートフォンの苦手としている高速全文検索処理を、簡単に実装できたのでMroongaを使ってよかったです。MySQLの拡張なのでエンジニアにとってハードルは低いのですが、ユーザには高いサービス品質(速度、精度)を実現できました。
ownCloud.jp
Groonga + Mroongaの組み合わせで使用しています。ownCloud自体には日本語全文検索機能はありませんが、企業様や教育機関様でもownCloudを抵抗なく導入できるように、(株)ビーグッド・テクノロジーがMroongaを使った日本語全文検索機能を独自に開発しました。(株)ビーグッド・テクノロジー提供のサポートを利用すると無償で提供します。
ownCloudにアップロードされた、テキスト、MS PowerPoint、MS Word、MS Excel、PDF等をApache Tikaでテキスト抽出してMroongaに取り込むことで、ownCloud上のコンテンツに対する日本語全文検索を実現しています。
オンラインストレージにアップロードしたコンテンツを日本語で全文検索出来るプロダクトは少なく、ownCloudの利用者様から多くのニーズを頂いておりました。そんな折、Mroongaに出会い、Mroongaのおかげで簡単に全文検索を導入でき、とても助かりました。ありがとうございました。
元々ownCloudはMySQLをDBとして動作するプロダクトですので、Mroongaとの親和性も高かったです。パフォーマンスとしても問題ありません。1万件ほどのコンテンツに対しても高速にキーワード検索できることを確認しています。
今後、検索画面にスニペットを表示する等、Mroongaの特徴を活かした機能に改良していきたいと思います。
みんなの英語ひろば
英会話の口コミ・評判がわかる!英会話教室なら みんなの英語ひろば
Groonga + Mroongaの組み合わせで使用しています。口コミ投稿時に英語教材・サービス(1.5万件ほど)をキーワード検索するために使っています。サーバー構成はLAMP(CentOS、フレームワークはCakePHP)です。今後、色々とチューニングしてみたいと思います。
Mroongaのおかげで簡単に全文検索を導入でき、とても助かりました。ありがとうございました。
病院検索BYOiN.me
全国の病院・クリニック・歯科・薬局を検索できる病院検索BYOiN.me
Groonga + Mroongaの組み合わせで使用しています。現在はキーワードとエリア検索に使用しており、16万件(1GB)のデータでも高速に動作しています。まだまだMroonga、Groongaの機能を活用していないのですが、今後は、重み付け、スニペットなどにも利用させて頂く予定です!
PatentField
Groonga + Mroongaの組み合わせで利用。全文検索はGroonga、データの更新はMroongaを利用しています。
PatentFieldは無料の特許情報検索サイトです。日本、海外主要国の特許情報を4,500万件以上収録。全文検索、連想検索、権利の死活情報やパテントファミリーに応じた絞り込みといった高度な特許検索サービスを提供しています。
全文検索、ドリルダウン検索、近傍検索、スニペットといったほぼ全ての検索機能およびデータストア機能をGroongaにより実現しています。ドリルダウン検索により特許分類、出願人、発明者、リーガルステータス等の煩雑なデータ項目を直感的に絞り込むことができます。
最大レコード数は1,000万以上、最大データサイズは400GiBを超えていますが、概ね高速に全文検索できています。
全国最新地価マップ
全国最新地価マップ 最新2012年 48,216件から検索可能
Rroonga + Mroongaの組み合わせで利用。
chikamap.comは中古住宅・土地購入の際に参考になる地価履歴やその周辺の公共施設・交通機関などの基本的な情報を地図から表示するためのサイトです。
隔週連載groongaに事例紹介記事「第2回 groongaをRuby On Railsでも使ってみた ~chikamap.comの事例から」があります。
nanapi
Groonga + Mroongaの組み合わせで利用。
nanapiは恋愛から生活ネタ、Webサービスの使い方まであらゆる生活のHowtoを集めているサイトです。
rec.to
rec.toは、Twitterのログを保存するサービスです。類似サービスとして老舗のTwilogがありますが、非公開アカウントに対応(本人と非公開アカウントのフォロワーのみ閲覧可能)しているのが特徴です。アイコンの変更も保存しているのでアイコン履歴を見ることもできます。
rec.toでは全文検索エンジンとしてMroongaが使われています。
HONYAKU STAR
Honyaku Starは、世界一総合的で、かつ自由なオンラインの日英辞書およびコーパスになることを目標としています。Honyaku Starは、単なる辞書ではなく、日英対訳コーパスでもあります。すなわち、あなたが検索した語句の用例や文脈を提供できる、対訳テキストのデータベースでもあるのです。単語や語句は、いくつもの妥当な訳語に対応していることが少なくありません。様々な異なる文脈での使用例を見ることによって、異なる意味や適切な使い方を理解することができます。Honyaku Starで検索すれば、辞書の検索結果と、用例を同時に得ることができます。
Honyaku Starの中ではLinux, PHP, Perl, MySQL, そして全文検索エンジンMroongaが使われています。
ikea-hikaku.com
IKEA通販価格比較.comは、IKEA製品全9,625件の通販/買い物代行価格を比較紹介するサイトです。
「MroongaはMySQLの全文検索エンジンです。サーバーはUbuntuを使用していて、apt-get でさくっとインストールできて超カンタンでした。(既存のmysqlを置き換えようとしたらうまくいかなくて新規セットアップしましたが)」
LayBrick beta
LayBrick beta TwitterとFacebookをひとつに。
LayBrickは、パーソナル検索可能なTwitter、Facebook、Instagramクライアントです。各サービスを同時に閲覧できるだけでなく、豊富な検索オプションで、あなただけの情報網から必要な情報を探しだすことができるのが特徴です。
Twitterのツイート、Facebookの投稿やリンクの概要、Instagramのキャプションなどをデータベースに保存し、Mroongaラッパーモード(ストレージエンジンはInnoDB)で全文検索できるようにしました。Senna+Tritonnより自由度が高くなって、本当に素晴らしいです。今後とも期待しております。
2ちゃんねる・PINKちゃんねる過去ログスレッドタイトル検索
2ちゃんねる・PINKちゃんねる過去ログスレッドタイトル検索
2ちゃんねるとPINKちゃんねるの過去ログに対するスレッドタイトル検索を提供しています。
以前はSenna + tritonnでしたが移行しました。2ちゃんねるのほうは現在4千万レコードの巨大テーブルになっていますが、実用的な速度での検索を提供できています。
sinsai.info
sinsai.info 東日本大震災 | みんなでつくる復興支援プラットフォーム
「sinsai.info 東日本大震災 | みんなでつくる復興支援プラットフォーム」は2011年3月11日に日本で発生した東北沖地震の復興を支援するために作られました。
Bizreach
年収1000万円以上の転職サイト Bizreach(ビズリーチ)
主に、職務経歴書情報の全文検索で使用しています。
以前は、MySQL(MyISAM)のFulltext Searchを利用していましたが、職務経歴書情報は、一レコードの量が大きく(平均3000文字程度、英語日本語混在)、Insertにとても時間がかかっていました。数秒かかることもしばしば。。Groonga + Mroongaに変えてからは、0.1〜0.2秒程度になり、しかも、ロックフリー、動的更新可能なので、参照ロック待ちも無くサクサクです。
また、検索時に関しても、MySQLの際は、アプリ側でNgramしてから、Insertしていました。日本語検索で、完全一致検索をしようとすると、フレーズ検索するしかなく、完全転置索引ではないので、めちゃくちゃ遅かったです。数秒かかったりしてました。MroongaでもNgramのParserを使用していますが、10〜20倍のパフォーマンスになり、0.1sをきっています。
現状10万弱のレコードで、問題なく安定稼働中です。本当にありがとうございます。