Yahoo!キーフレーズ抽出APIをpythonから使ってみた
ばずったーみたいなものを作りたくて、Mecabでほげほげしてたのですが、Yahoo!からなんか便利そうなAPIが出たので使ってみました。
Yahoo!デベロッパーネットワーク - テキスト解析 - キーフレーズ抽出
このAPIはJSONで返してくれるので、超簡単に使えました!
以下Python2.6でのサンプルです。
# -*- coding:utf8 -*- import urllib import urllib2 import json text = u"東京ミッドタウンから国立新美術館まで歩いて5分で着きます。" url = "http://jlp.yahooapis.jp/KeyphraseService/V1/extract" params = { "appid":"ApplicationID", "sentence":text, "output":"json", } json_data = urllib2.urlopen(url,urllib.urlencode(params)).read() result = json.loads(json_data) for k,v in result.iteritems(): print k,v
実行結果は以下のとおり
結果が返ってきた時点では、Y!独自の謎のスコア順にソートされているのですが、pythonの辞書に変換してループさせると順序が保たれないので、その辺は適当にソートすると良いと思います。
@tohae_callのタイムライン200件分でAPIを使ってみました。bit.lyがトップに来て、ちょっと残念な感じですが、おかしな複合語が大量に出てくるような事もないので、割と使えるかもしれません。
Mecab使って適当にやってたら、もっと悲惨な感じになったので、本当便利な世の中になったものです…