AI/機械学習の登場によってテキスト解析分野は大きく発展しています。テキストの中から意味を読み取ったり、テキストを加工したりするのにAI/機械学習が用いられています。もちろん自分で構築することもできますが、APIを使うことで、素早く結果を得られるようになるでしょう。
今回はそうしたAIによるテキスト解析を提供するAPIをまとめて紹介します。なお、チャットボットに活用する用のAPIは多数あるため、今回は省いています。
Microsoft Azure
Text Analytics
正規化されていないテキストからエンティティ、関係、キーフレーズなどを抽出するテキスト解析APIです。
Text Analytics | Microsoft Azure
Translator
90以上の言語に対応したテキスト翻訳APIです。固有の単語を登録して、カスタマイズもできます。
Yahoo! JAPAN
建設的コメント順位付けAI API
コメントを評価するAPIです。議論を喚起する、客観的かつ根拠を提示しているコメントなどを高評価する仕組みになっています。
深層学習を用いた自然言語処理モデル(AI)のAPIを無償提供 ー 導入をご検討の企業のみなさまへ(2021年5月19日更新)
A3RT
Text Summarization API
文章要約APIです。Doc2Vecを用いたモデルを利用しています。
Text Summarization API | PRODUCT | A3RT
Proofreading API
誤字脱字チェックを行うAPIです。助詞の間違いなども指摘してくれます。
Proofreading API | PRODUCT | A3RT
Named Entity API
LSTMによって固有表現を抽出するAPIです。文章から人名や地名などを抽出できます。
Named Entity API | PRODUCT | A3RT
SQL Suggest API
自然言語をSQLに変換します。質問文とSQLを大量に学習させる必要があります。
SQL Suggest API | PRODUCT | A3RT
Watson
Watson Language Translator
ニュース・会話・特許に最適化されたモデルが用意された翻訳APIです。単語を独自に登録したカスタマイズも可能です。
Watson Language Translator - 概要 - 日本 | IBM
Watson Natural Language Classifier
テキストの分類を行います。学習データはCSVファイルで用意するだけという手軽さがポイントです。
Watson Natural Language Classifier - 概要 - 日本 | IBM
Watson Tone Analyzer
テキストを分析して感情や性格的傾向、文体のトーンを検出します。
Watson Tone Analyzer - 概要 - 日本 | IBM
Google Cloud
Cloud Natural Language
非構造化テキストから人や場所、イベントなどに関する情報を抽出します。さらにテキストの構造や意味を明確にします。
Cloud Natural Language | Google Cloud
Cloud Translation
100以上の言語に対応した翻訳エンジンです。言語の検出機能もあるので、ユーザが作成した自由な文章に対しても適用できます。
Cloud Translation | Google Cloud
AWS
Amazon Comprehend
非構造化テキストを分析し、人や場所、言語などの情報を抽出します。また、テキストをトピックに分類も可能です。
Amazon Comprehend(テキストのインサイトや関係性を検出)| AWS
その他
DeepL API
精度の高い翻訳を提供するDeepLのAPIです。1ヶ月に50万文字までは無料で利用可能です。
Lexalytics
自然言語のテキスト分析、感情分類、トピック分類などを行うAPIです。
Data Analytics with NLP & Text Analytics | Lexalytics
MonkeyLearn
テキストを解析してトピック、感情、インテント、キーワードなどの情報を抽出します。
まとめ
多くのAPIがテキストから意味を見いだすのに利用できます。非正規化されたテキストから意味を見いだせれば、アンケートの自由記入であったり、ドキュメントやレポートなどから重要なポイントが分かるようになるでしょう。
テキストはインターネット上に最も多く存在するコンテンツになりますので、それらを分析することで、さらなる活用が見いだせることでしょう。