INFORMATION
サービス
Apache OpenNLPの商用サポートサービスを開始
株式会社ロンウイット(本社:東京都千代田区、代表取締役社長:関口 宏司) は、オープンソースの自然言語処理エンジン「Apache OpenNLP」の一部機能の商用サポートサービスの提供を開始します。(2018年7月17日)
機械学習による自然言語処理エンジン Apache OpenNLP は7月2日に日本語をサポートした最新バージョン 1.9.0 がリリースされました。同社代表である関口が OpenNLP のコミッターとして日本語をサポートする機能の開発に携わり、日本語データによる検証を行い、このたびのサービスリリースにいたりました。
サポートサービスを提供する OpenNLP の機能は以下の通りです。
- 固有表現抽出
- 文書分類
- 言語判別
日本語などの自然言語で書かれたテキストには人名、地名、組織名などの固有名詞が含まれています。これらの固有名詞を属性(固有名詞タイプ)付きで抽出する技術が「固有表現抽出」と呼ばれるものです。 たとえば、検索エンジンなどのアプリケーションと組み合わせて使うと、検索精度向上に役立てることができます。
固有名詞タイプは、人名など一般的なものから、病名、料理名、イベント名など、アプリケーションに応じてさまざまなタイプを使うことができます。以下に固有表現抽出を使ってさまざまなタイプの固有名詞を抽出している解説記事がありますので、ご覧ください。
https://www.rondhuit.com/apache-opennlp-1-9-0-ja-ner.html
新聞記事など自然言語で書かれた記事・文書に分類ラベルを自動付与する機能です。たとえば文書を投稿するサイトで、投稿された文書に自動的に「スポーツ」「芸能」「政治」「経済」などのラベルを自動付与するなどの応用例が考えられます。
分類される対象はテキスト文書に限りませんので、自動与信審査やスパムメール判定などにも応用することが可能です。
自然言語で書かれたテキストが「何語」で書かれているかを自動判別する機能です。日本語、英語はもちろんのこと、ドイツ語、フランス語、ロシア語、 アラビア語、中国語、韓国語など 103 言語をカバーしています。
Apache OpenNLP をアプリケーションに組み込む場合、ある程度の専門知識が必要となります。ロンウイットでは Apache OpenNLP の導入を支援するコンサルティングサービスも提供します。
また、ユーザー企業自身が専門知識を習得できるよう、Apache OpenNLP の研修コースを開発することや、運用後にモデルファイルの性能を定期的に評価するアセスメントサービスの導入も検討しています。
Apache OpenNLP, OpenNLP, Apache, the Apache feather logo, and the Apache OpenNLP project logo are trademarks of The Apache Software Foundation.INFORMATION
KandaSearch
KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。
セミナー
企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!