読者です 読者をやめる 読者になる 読者になる

Yahoo!キーフレーズ抽出APIをpythonから使ってみた

ばずったーみたいなものを作りたくて、Mecabでほげほげしてたのですが、Yahoo!からなんか便利そうなAPIが出たので使ってみました。
Yahoo!デベロッパーネットワーク - テキスト解析 - キーフレーズ抽出

このAPIはJSONで返してくれるので、超簡単に使えました!
以下Python2.6でのサンプルです。

# -*- coding:utf8 -*-
import urllib
import urllib2
import json

text = u"東京ミッドタウンから国立新美術館まで歩いて5分で着きます。"
url = "http://jlp.yahooapis.jp/KeyphraseService/V1/extract"
params = {
    "appid":"ApplicationID",
    "sentence":text,
    "output":"json",
}
json_data = urllib2.urlopen(url,urllib.urlencode(params)).read()
result = json.loads(json_data)
for k,v in result.iteritems():
    print k,v

実行結果は以下のとおり

東京ミッドタウン 32
国立新美術館 100
5分 5

結果が返ってきた時点では、Y!独自の謎のスコア順にソートされているのですが、pythonの辞書に変換してループさせると順序が保たれないので、その辺は適当にソートすると良いと思います。

@tohae_callのタイムライン200件分でAPIを使ってみました。bit.lyがトップに来て、ちょっと残念な感じですが、おかしな複合語が大量に出てくるような事もないので、割と使えるかもしれません。
Mecab使って適当にやってたら、もっと悲惨な感じになったので、本当便利な世の中になったものです…