言語処理
文字列処理
漢字かな変換
漢字かな変換とは、漢字から「かな」に変換するツールです。
テキストマイニング (Text mining)
自然言語処理 (Natural language processing : NLP)
特徴語 (Feature terms)
- Bag of Words … 単語の並び方は考慮しない
- TF (Term Frequency) … 単語の出現頻度 = ある単語の出現回数 / 単語の総数
- TF-IDF (Term Frequency-Inverse Document Frequency / tf-idf / TFIDF) = 単語の出現頻度 / 逆文書頻度 tf–idf - Wikipedia
自動要約 (Automatic summarization)
要約サービス
ライブドアニュースの各ページには「ざっくり言うと」という要約が表示されますが、これは人間が編集しているようです。「ざっくり言うと」から学ぶ!スマホ時代のウェブコンテンツに最適な「要約」のススメ - ライブドアニュース (2013/03/07)
要約ツール
参考