日本語形態素解析API

日本語の文を、形態素に分割した結果を得られるAPIです。

リクエスト

リクエストURL:https://jlp.yahooapis.jp/MAService/V1/parse

GETではクエリの最大長を超える恐れがあるため、対象のテキストが長くなるならばPOSTでリクエストします。Yahoo!デベロッパーネットワーク:WebAPIの使い方(POSTリクエスト) - Yahoo!デベロッパーネットワーク

パラメータ

パラメータ 説明
appid アプリケーションID
sentence 解析対象のテキスト
results ※1 解析結果の種類
  • ma … 形態素解析の結果を、ma_resultに出力
  • uniq … 出現頻度情報を、uniq_resultに出力
複数の項目はカンマ区切りで指定。既定は「ma」
response 解析結果に含む形態素情報
  • surface … 表記
  • reading … 読みがな
  • pos … 品詞
  • baseform … 基本形表記
  • feature … 全情報
複数の項目はカンマ区切りで指定。既定は「surface,reading,pos」
filter 解析結果に含む品詞

複数の項目は | で区切って指定。

uniq_by_baseform trueならば、出現頻度情報 (uniq_result) を基本形の同一性により求める

たとえば「庭には羽ニワトリがいる」を、「庭には2羽ニワトリがいる」と解釈する

※1 解析結果は、resultsの指定により2種類の情報を一括して取得できます。そのときresponseとfilterパラメータの指定を個別に適用するには、以下のパラメータでresponseまたはfilterの値を指定します。

種類 パラメータ 説明
形態素解析 ma_response ma_resultの結果にだけ、responseの設定を適用する
ma_filter ma_resultの結果にだけ、filterの設定を適用する
出現頻度情報 uniq_respose uniq_resultの結果にだけ、responseの設定を適用する
uniq_filter uniq_resultの結果にだけ、filterの設定を適用する

レスポンス

responseパラメータは未指定 (既定値の'surface,reading,pos')
ma_resultフィールド uniq_resultフィールド
<ma_result>
  <total_count>3</total_count>
  <filtered_count>3</filtered_count>
  <word_list>
    <word>
      <surface>庭</surface>
      <reading>にわ</reading>
      <pos>名詞</pos>
    </word>
    <word>
      <surface>に</surface>
      <reading>に</reading>
      <pos>助詞</pos>
    </word>
    <word>
      <surface>は</surface>
      <reading>は</reading>
      <pos>助詞</pos>
    </word>
  </word_list>
</ma_result>
<uniq_result>
  <total_count>3</total_count>
  <filtered_count>3</filtered_count>
  <word_list>
    <word>
      <count>1</count>
      <surface>に</surface><reading/>
      <pos>助詞</pos>
    </word>
    <word>
      <count>1</count>
      <surface>は</surface><reading/>
      <pos>助詞</pos>
    </word>
    <word>
      <count>1</count>
      <surface>庭</surface><reading/>
      <pos>名詞</pos>
    </word>
  </word_list>
</uniq_result>
responseパラメータに'surface,reading,pos,baseform,feature'を指定
ma_resultフィールド uniq_resultフィールド
<word>
  <surface>庭</surface>
  <reading>にわ</reading>
  <pos>名詞</pos>
  <baseform>庭</baseform>
  <feature>名詞,名詞,*,庭,にわ,庭</feature>
</word>
<word>
  <count>1</count>
  <surface>庭</surface>
  <reading/>
  <pos>名詞</pos>
  <baseform>庭</baseform>
  <feature>名詞,*,*,庭,,庭</feature>
</word>
形態素情報
フィールド 説明
surface 形態素の表記
reading 形態素の読みがな
pos 形態素の品詞 (Part Of Speech)
baseform 形態素の基本形表記
(活用のない形態素の場合は省略)
feature 形態素の全情報
品詞
品詞番号 品詞
1 形容詞
2 形容動詞
3 感動詞
4 副詞
5 連体詞
6 接続詞
7 接頭辞
8 接尾辞
9 名詞
10 動詞
11 助詞
12 助動詞
13 特殊 (句読点、カッコ、記号など)

取得例

 

利用制限

  • 1回のリクエストは、100kBまで
  • 24時間でのリクエストは、1つのアプリケーションIDにつき50,000回まで
利用制限 - テキスト解析:日本語形態素解析 - Yahoo!デベロッパーネットワーク

リクエスト時にはパラメータをエンコードして渡すため、UTF-8の「あ」の1文字でも「%E3%81%82」の9バイト必要です。