将棋棋士データベースで遊ぶ(7)〜棋士名でワードクラウドを作る〜

※この記事は「将棋 Advent Calendar 2016 – Adventar」の19日目です。

将棋連盟の棋士データベースを使って色々と遊んでみるシリーズ、今回は棋士名に使われている文字を分解してワードクラウド(タグクラウド)を作ってみたいと思います。

棋士名でワードクラウド

出来上がったワードクラウドがこちら。

棋士名ワードクラウド

棋士名に使われている文字を一文字ずつに分解して集計し、その文字が使われている数が多ければ大きく、少なければ小さく表示されるようになっています。

本当は姓名を分けて名前だけでやりたかったのですが、棋士データベースは姓名の区切りが分かるようになっていなかったので断念。そのせいか、やはり大きな文字は名字によく使われる漢字がほとんどを占めたようです。

ちなみにこちらが多かった文字のトップ10。「田」の圧倒的勝利でしたね。

文字 回数
54回
31回
31回
26回
23回
22回
19回
18回
17回
17回

作り方

ワードクラウドの作成にはこちらのライブラリを使わせてもらいました。

こんな php スクリプトを走らせて、棋士データ全部入りの kishi_all.json からどの文字が何回使われているかというワードクラウド用のリストを作りました。

この記事で作ったコードは全てこちらに上げてありますので、ご自由にご覧ください。

PHPが好きなWeb系エンジニアです。フリーランスでWebサイト制作やWordPressのカスタマイズ、システム開発等を雑多にこなしています。バンカラ応援好きの振り飛車党。 高校野球 / 将棋 / WordPress / ブログ / 食べること / 二児の父親 >>詳しいプロフィールはこちら