情報中毒者、あるいは活字中毒者、もしくは物語中毒者の弁明

情報中毒者、あるいは活字中毒者、もしくは物語中毒者の弁明


漫画、あるいは小説、もしくはエッセイなどの
印象、あるいは連想、もしくは感想を書いてるBlog。

2020年に出たコミックスのタイトルで、一番多く使われた漢字は「女」でした



 f:id:soorce:20201226171753p:plain
 今年出たコミックスで、一番多く使われた漢字はなんなのか、ふと気になって調べてみました。


 記事内容のより詳しい結果は、調査に使用した元リストと結果が入ったGoogleスプレッドシートを公開してありますので、下のリンクからどうぞ。

上位の結果


 上位20位タイまでは、こんな結果になりました。


順位漢字
1378
2370
3319
4313
5301
6298
7293
8287
9266
10228
11219
12209
13201
14158
15152
16137
17129
18128
19128
20122
20122

雑感など


 1位の「女」は、「乙女」「魔女」「少女」「彼女」などなど。「男」の3倍以上使われてます。
 2位の「生」は、「転生」「先生」「(高校生・同級生など)学生」「生活」など、使い所が多いのも影響してるか。
 3位の「世」は、「異世界」だけで半分の182。「世界」にすると267。まあそうか。
 5位の「恋」は、タイトルの頭になってるが74作品で、比率的に最多かも。


 10-03-07-14-02で「異世界転生」が出来上がるなあ。
 それ含め、1文字のイメージからなろう系っぽさが感じられるのが多いかも。「魔」「神」「強」あたりとか。


 他に多そうだと思って調べた単語で言うと「転生」が119回、「最強」が97回ですね。


 今年の最大ヒット作であるあの作品の漢字は
 「鬼」:68回
 「滅」:27回
 「刃」:5回


 で、「刃」が意外と少ない。というか、該当したのが「鬼滅の刃」、「鬼滅の刃 外伝」、「白刃と黒牡丹」、「TVアニメ『鬼滅の刃』 公式キャラクターズブック 弐ノ巻」、「刀剣乱舞―ONLINE―アンソロジー~戦場にきらめく刃~」なので、実質は2作品+関連書籍って事になるのか。来年凄く増える可能性はある、のかな?


 あと、漢字以外(ひらがな、カタカナ、数字、記号など)の上位10はこう。「の」が強すぎるんだよなあ……。

順位
12806
2*11798
31461
41363
51101
61086
71066
81062
91011
10969


 ちなみに、1回しか出てこなかったのは470文字。


 哀茜梓虻絢或杏威慰易壱飲閏噂泳詠駅悦宴延沿煙汚凹央旺欧沖牡寡禍菓芽悔拐魁晦械蟹崖蓋殻赫郭潟喝渇褐株釜鴨茅姦患棺貫閑岩伎基嬉幾旗祈妓技欺疑脚窮拒兇協叫怯均句狗玖駒偶隅繰圭恵敬桂繋蛍兼検弧枯湖股誇跨呉吾悟檎瑚醐乞倖功効勾垢紘耕肯閤項剛克狛梱紺詐鎖栽采砦斎載剤阪榊埼鷺搾朔索匙擦皐傘珊酸斬姿施肢詞試雌歯滋磁叱疾篠縞赦煮謝遮借杓寂趣州臭舟衆酬醜充汁淑駿殉巡署尚彰晶肖衝詳醤鐘丈杖譲拭辱唇壬厨吹帥炊髄杉栖逝隻積籍蹟接扇撰旋銭閃禅膳噌楚祖蘇鼠爽痩贈則損袋鯛醍滝瀧濯只叩巽狸鱈単嘆炭耽胆誕智置竹貯兆懲聴捗沈墜痛槻辻綴鍔剃艇訂邸釘摘笛哲轍添唐棟答豆瀞敦捺縄弐匂如燃粘濃巴婆排倍培這剥曝罰鳩班繁否斐疲碑緋費眉漂浜敏瓶楓蕗伏淵沸吻紛塀並碧舗墓泡芳褒傍忙棒吠朴勃堀奔翻埋槙俣繭巳牟銘免綿麺茂毛盲網貰也弥訳躍薮唯柚湧邑融与誉螺洛絡吏律琉了涼糧励怜暦裂憐漣煉蓮呂露廊弄肋鷲湾仄侘傅儚儡冤冰凰刹吽咥囀址埒墟娑學寇幇弩彷徨恍惧慄憫懊曰霸杞柩栞棘棗榮橙檻櫃櫻欅泪濤涸滸漱潭澪濱爛爬犲猥獏珀琥疼痺眷祀祟穢箒籠籃翡苺蕾藝蜃蝮蹂躙躾鐵閻韋颯騙驍髏髑魍魎鳰鶯鵺靡遙朗礼祥逸隆到寵憎。


 ソートの都合だけど、「哀」で始まり「憎」で終わるというのがなかなか。
 逆に言えば、この文字が入ってるタイトル、と一発でわかるってことですね。
 竈門炭治郎の「炭」なら「微炭酸なぼくら」だけです。


データについて


 タイトルデータの取得元は、楽天のコミック新刊カレンダー(2020年1月~2020年12月)。


 ここからタイトルを取ってきまして

  • 巻数を消す(全角カッコで囲まれた文字を正規表現で削除)
  • 全角英数→半角英数に置換
  • 半角スペース・全角スペースを削除
  • 重複を削除

 とした結果、6676タイトルになりました。


 ただし、表記ブレとかで被ってる場合もあるし、イラスト集とかもあるし、発売延期や中止も含まれてるので、実数はもう少し少なくなるはず。
 スピンオフとかもどうかな。
 また、楽天のには成年向けやデジタルのみのが入って無いから、その辺入れたらかなり違う結果が出るような気もします。


 あとは、1文字づつに分解して、重複をカウントするプログラムをちょちょっと作って結果を出しました。


 こちらのGoogleスプレッドシートに全データおいてあるので、検証したい方や下位まで順位を見たい方はどうぞ。


 単語単位での分解、語素分析なんかやってもいいかもですね。
 古い年度から蓄積するともっと色々わかりそうな気もするのですが、大変そうなので、やりたい人がやってください。


 といったところで今回はここまで。

*1:長音記号