Yahoo!の日本語形態素解析API

Yahoo!の日本語形態素解析APIを使ってみる。
利用にはあらかじめアプリケーションIDの登録が必要。利用の条件は、

  • 日本語形態素解析Web APIは、24時間以内で1つのアプリケーションIDにつき50000件のリクエストが上限
  • また、1リクエストの最大サイズを100KBに制限しています。

等々。詳しくは、このページあたり参照。
で、アプリケーションIDを取得した後、早速PHPで使ってみる。

<?php
/**
 * Yahoo!形態素解析APIサンプル
 */
require_once 'HTTP/Request.php';
$yahooappid = "foobar..."; // ここにYahooから取得したアプリケーションIDを記載。
// --- 形態素解析対象の文章と文字コード変更
$sentence = "PHPは、HTML埋め込み型のサーバサイド・スクリプト言語として分類される。この言語処理系自体は、C言語で記述されている。";
// --- API呼び出し
$url = 'http://jlp.yahooapis.jp/MAService/V1/parse';  // APIのコール先
$request = new HTTP_Request($url);
$request->addQueryString('appid', $yahooappid);
$request->addQueryString('sentence', $sentence);
$request->addQueryString('results', 'uniq');
$request->addQueryString('filter', '9');    // 名詞でフィルタ
if (PEAR::isError($request->sendRequest())) {
die('request failed');
}
$resp = $request->getResponseBody();
$wordscun = array();
$xml = new SimpleXMLElement($resp);
foreach ($xml->uniq_result->word_list->word as $wd) {
printf("%s (count:%d)\n", $wd->surface, $wd->count);
}
?>

こんな形で良いのではないだろうか。
出力結果は次の様になる。

/Users/hideack/pj/feeddown2/ex% php yahooapi.php
言語 (count:3)
HTML (count:1)
PHP (count:1)
サーバ (count:1)
スクリプト (count:1)
処理 (count:1)
分類 (count:1)
埋め込み (count:1)
自体 (count:1)
記述 (count:1)

サンプル中の文書が解析されて名詞のみが抽出されている。
処理対象文書が少ない場合、あるいは、レンタルサーバ等々の事情でchasen等々が導入できない場合は便利なのではないだろうか。

焼き肉(ホルモン)

id:its-tomまた食べに行った。
f:id:hideack:20090618203855j:image
うん。まぁ、美味しいからいいか。
あと、私がギブアップになっても彼は2皿更に注文していた。なんか多少しか歳は離れていないはずなのだけど、妙に年齢差を感じた。

今日のひとことたち

http://h.hatena.ne.jp/hideack/ の一言まとめ

  • 22:28:00 またホルモン焼きを食べにいった。
  • 19:36:00 いつも朝みかける某党某議員が、応援演説中。朝は淡々とした感じだが、夜だからかテンションが高く、かなり熱い。
  • 12:26:00 昨夜、明太海苔弁当を食べたのに、さっき明太パスタを食べてきた

Apacheのmod_rewriteに関するメモ

どうしてもApacheのmod_rewriteにお世話にならなければならない事情が生じてしまったのでいくつか調査。
googleで検索すればかなりの資料とかメモが出るので苦労はしなかったけど、簡単にまとめてあるものがないかな。ということで見つけたのがこのチートシート

The mod_rewrite cheat sheet is a one-page reference sheet, listing flags for the RewriteRule and RewriteCond directives, list of server variables, a regular expression guide and several examples of common rules.
mod_rewrite Cheat Sheet (V2)

便利だと思い、すぐにはてなブックマークでブックマークしたら、この日本語版も見つかった。
はてブ恐るべし。

非常に良質のチートシートを作られているAddedBytes.comさんのところから、mod_rewrite Cheat Sheet (V2)を日本語化しました。
mod_rewrite Cheat Sheet 日本語版

これがあれば、いざ取りかかるときにすぐにやりやすい。これでなんとかなるに違いない。

横濱ハヤシヌードル

今日の晩ご飯はコンビニで買った日清カップヌードルの横浜港開港150周年記念商品。
地域限定のカップヌードル"横濱ハヤシヌードル"を会社の机で食べる。
f:id:hideack:20090612005834j:image
これ、おいしい。
最初、ハヤシソースが合うのかなぁ?と思ったのだけど、一口食べて不安はぶっ飛んだ。
中にちゃんと牛肉もカップヌードルということを考えれば大きめのものが入っていて、しかも美味しい。
スープもハヤシなんだけど、ちゃんと麺に合う味になっているがすごい。ハヤシライスのソースそのまんまという訳でもなく、かといって全然別物になっているわけでもなく。

すべてにおいて食べるスピードが遅い自分が近年稀に見るスピードで完食。
日清食品の製品開発力に感服。

期間限定なのかわからないのだけど、これはシリーズに入れても全然ありだと思うのだけどなぁ。
カレーがあるのだからハヤシもあってよいではないか!!
と、ささやかにシリーズ化熱望しつつ、今日も遅いのでとっとと寝なければ。

渋谷で大量に肉を食べる

友達と集合して夕食を食べるべく渋谷へ。若者たくさん。そして、GREEのクリノッペもたくさん。
渋谷駅出て見回したらどこでも目についた。これはすごい。
記念に写真を撮っておいた。
f:id:hideack:20090607182426j:image
写真を撮っていたら目の前を広告トラックが走ってる。
f:id:hideack:20090607182429j:image
なんかすごいな。このプロモーション。

晩ご飯は友達と集まってブラジル料理のお店へシュラスコを食べに行く。
18時過ぎにお店に流れ込むものの人気店らしく時間が75分限定だったりしたのだけど、店員が次から次へと、"ドーダコノヤロ"的に持ってくるお肉を食べていると30分で十二分に満足してしまった。
終盤はサンバのお姉さんが突如現れて"ナンダナンダ"と思っていたらお隣のテーブルの若者がステージで踊っていた。楽しそうでいいではないか。

と、その後いささか飲み足りない*1ということで、居酒屋さんへ流れ込む。
1軒目とは打って変わって魚であります。みりん干し万歳。
そして、何故1軒目の料理を写真に撮らなかったのだろうと、未だに謎である。
f:id:hideack:20090607182428j:image
そして、先ほどは飲めなかったのでお酒を大量にウグウグと補給。
f:id:hideack:20090607182424j:image
f:id:hideack:20090607182425j:image
最近、目につくと必ず飲んでるハイボールを飲む。
料理問わず比較的あわせやすいのがよいのだな。

案の定、えらく飲んだので電車でオーバランしつつ収束して無事帰宅。
楽しい夜であった。

*1:飲み足りないのは私だけであっただろうけど