2021年9月23日木曜日

統計の相関から意味を読み取ってみる1

<目的>統計ダッシュボードからダウンロードした統計のデータを使って相関係数を求めそこから気になる問題に対する答えを読み取ること!!です。

「2016年の項目の相関係数を大きい順に表示」lhttp://riepnyo-homepage.babyblue.jp/tokeisokan.htmlというサイトでいろいろな項目の相関を調べてみて意味を読み取ってみます。

まず気になっているのは温暖化問題なのでリストボックスの「大分野」→「司法・安全・環境」を選んで「小分野」→「温室効果ガス算定排出量(実数)2015」を選ぶと相関係数が高い順に表示されます。

<結果です>

工業用水量(淡水)2015:0.9523

工業用水量2015:0.9384

工業用水量(海水)2015:0.8364

最終エネルギー消費量2016:0.8217

一般粉じん発生施設数2017:0.8006

製造業事業所敷地面積2017:0.8

[雇用力]運輸に附帯するサービス業2016:0.7873

[稼ぐ力]運輸に附帯するサービス業2016:0.7522

発電電力量2016:0.7063

交通事故死者数2016:0.6732

中間処理後再生利用量2016:0.6704

[雇用力]機械等修理業(別掲を除く)2016:0.6667

介護老人保健施設数2016:0.6532

短期入所療養介護事業所数(介護老人保健施設)2016:0.6493

[稼ぐ力]機械等修理業(別掲を除く)2016:0.6436

老人クラブ数2016:0.6433

軽自動車及び小型特殊自動車台数2016:0.6408

通所リハビリテーション事業所数(介護老人保健施設)2016:0.6367

任意自動車保険保険金支払件数2016:0.6362

軽自動車等の賦課期日現在台数2016:0.6351

緑道面積2016:0.6346

診療科目別一般病院数(肛門外科)2016:0.6329

任意自動車保険保険金支払金額2016:0.6297

保有自動車数(乗用車)2016:0.6288

離別人口(25~29歳)(男)2015:0.6259

民生委員(児童委員)相談・支援件数2016:0.6258

・・・・・・

のように最も相関があるのは製造業=工場関係でその次に生活関係自動車関係も相関が高いです。これは温室効果ガスが二酸化炭素や窒素酸化物であり一般に原因といわれてる排出元と一致します。ビニール袋やプラスチックがやり玉に挙がってますが、それらを減らすことでごみ排出量を減らそうということなら、ごみ排出量自体は・・・・

ごみ処理量(総量)2016:0.5133

ごみ総排出量(総量)2016:0.5118

ごみ計画収集人口2016:0.4967

ごみのリサイクル率2016:0.4346

ごみ処理量(直接資源化)2016:0.2939

1人1日当たりのごみ排出量2016:0.044

(空白に「ごみ」→「文字列検索」とすると指定文字の入った項目だけの相関係数を得られます)

のように割と緩い相関があります。1人1日当たりのごみ排出量は相関がない!というわけで温暖化の犯人工場エネルギー消費運輸です。ビニール袋じゃないことは全員承知していると思いますが本当は工場=生産活動です。しかしこれを停止すると経済と生活が立ち行かなくなるのでそんなことはできないのでビニール袋とプラスチックを攻撃しています。「一人ひとりの意識を変えるためにプラスチックやビニールの使用を減らす」という作戦でしょうけど、有効な方法=工場からの排出を減少させることを知っていながら人々の意識をどう変えるというのでしょう?確かにビニールもプラスチックも工場で生産されるのでそれらの消費→生産を抑えれば温室効果ガス排出は減るでしょうが、工場はそれだけじゃありません。生産されて消費されればごみになるのでビニールやプラスチックを別の素材にしてもごみ処理量は変わらないのでは?と思いますし、プラスチック代替品を工場で生産すれば結局同じだと思います。電気をガンガン使って、工場で生産された製品を宅配してもらって大量消費するという快適な生活を捨てないと温暖化の阻止はできないということでしょう。


次に気温の上昇は一体何が原因なのか?本当に温室効果ガスのせいなのか気になるので調べてみました。リストボックスの「大分野」→「国土・気象」を選んで「小分野」→「年平均気温2016」を選ぶと相関係数が高い順に表示されます。

<結果です>

最低気温(日最低気温の月平均の最低値)2016:0.9373

出生率(人口千対)2016:0.7281

最高気温(日最高気温の月平均の最高値)2016:0.7102

学業の平均時間(10歳以上)(男)2016:0.6137

降水量(年間)2016:0.5746

[稼ぐ力]飲食店2016:0.5636

[雇用力]飲食店2016:0.5565

合計特殊出生率2016:0.5382

自然増減数2016:0.5344

[稼ぐ力]医療業2016:0.5284

ルームエアコンの1000世帯当たり所有数量(二人以上の世帯)2014:0.5245

[雇用力]医療業2016:0.5221

学業の平均時間(無業者)(女)2016:0.5024

1人当たり後期高齢者医療費2016:0.502

自然増減率(人口千対)2016:0.4954

・・・・・・

光熱・水道(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:-0.6647

光熱・水道(二人以上の世帯)(全国消費実態調査)2014:-0.6872

耕地面積(田)2016:-0.7017

評価総地積(田)2016:-0.7029

雪日数(年間)2016:-0.8488

気になったのは子供が増えると気温が上がるのかなということです。じゃなくて気温が高いから子供が増えるのかもしれません。生物の本能的に危機を感じて?子供を産みたくなるのかなと。温室効果ガスとの相関はないですが、これはガスが地域にとどまるわけではなく”地球規模に温めるので”ということでしょう。のどかな田園風景は負の相関があり田圃が多いところは涼しいという感覚は正しそうです。田圃の水が気化するときに熱を奪うということもあると思います。田圃を増やせば涼しくなるのではと思います。後、生活関係のエアコンは暑いから使用が増え(光熱・水道が負の相関も原因がエアコン?)、医療・飲食店は暑くて熱中症が増えたり、涼を求めて飲食店?かと思います。気温上昇と温室効果ガス排出量は直接の相関はありませんでした。


では近年多発する災害は何かと相関しているのでしょうか?信仰心とか?リストボックスの「大分野」→「司法・安全・環境」を選んで「小分野」→「災害被害額2016」を選ぶと相関係数が高い順に表示されます。

<結果です>

寄附金(都道府県財政)2016:0.9542

災害に関係したボランティア活動行動者率(10歳以上)2016:0.9077

災害復旧事業費(市町村財政)2016:0.4365

災害復旧費(市町村財政)2016:0.436

[雇用力]その他のサービス業2016:0.4338

仕事の平均時間(有業者)(男)2016:0.4279

・・・・・・・

家事の平均時間(有業者)(男)2016:-0.3426

身の回りの用事の平均時間(10歳以上)(女)2016:-0.3442

というわけで、ほぼ何とも相関がないと言えます。(災害関係以外とは)。信仰心を「宗教」「信者」でそれぞれ検索すると・・・

[稼ぐ力]宗教2016:-0.0271

教員・宗教家2015:-0.0272

[雇用力]宗教2016:-0.0599

宗教団体数2016:-0.0971

仏教系信者数2016:-0.0318

キリスト教系信者数2016:-0.0347

信者数2016:-0.0491

神道系信者数2016:-0.0773

諸教信者数2016:-0.0921

信仰心の有無災害と関係がなくてほっとしました。宗教に「信仰心がないせいで災害に巻き込まれた」などと不安をあおられて気に病む必要は全くないということです。


では格差はなぜ生じるのか?を知りたいので、リストボックスの「大分野」→「企業・家計・経済」、「小分野」→「年間収入のジニ係数(二人以上の世帯)2014」。

<結果です>

年間収入のジニ係数(二人以上の世帯のうち勤労者世帯)2014:0.6697

[雇用力]保険業(保険媒介代理業,保険サービス業を含む)2016:0.464

[稼ぐ力]保険業(保険媒介代理業,保険サービス業を含む)2016:0.4488

診療科目別一般診療所数(臨床検査科)2017:0.4354

公衆浴場数2016:0.4225

[雇用力]補助的金融業等2016:0.4208

都市計画費(都道府県財政)2016:0.4034

航空輸送人員2016:0.4021

[雇用力]インターネット附随サービス業2016:0.4017

[雇用力]映像・音声・文字情報制作業2016:0.3994

臨床学的検査2016:0.3994

事業者(ハイヤー・タクシー)2014:0.3989

売上金額(民営)(情報通信業)2015:0.397

[雇用力]専門サービス業(他に分類されないもの)2016:0.3968

航空貨物輸送量2016:0.3967

・・・・・・・・

ピアノ・電子ピアノの1000世帯当たり所有数量(二人以上の世帯)2014:-0.4142

実質公債費比率(都道府県財政)2016:-0.4361

[稼ぐ力]金属製品製造業2016:-0.4368

[稼ぐ力]プラスチック製品製造業(別掲を除く)2016:-0.4578

係数の値が小さく、少しわかりにくいですが第四次産業が格差を広げ(ジニ係数が1に近づく)、第二次産業=製造業は格差を小さくする(ジニ係数が0に近づく)と言えます。(第四次産業とは「非対面のサービス業」と定義しています。)

ジニ係数のもう一方の項目はどうでしょう?「大分野」→「企業・家計・経済」、「小分野」→「年間収入のジニ係数(二人以上の世帯のうち勤労者世帯)2014」ではちょっと違いますがほぼ同じ傾向です。

<結果です>

年間収入のジニ係数(二人以上の世帯)2014:0.6697

[雇用力]政治・経済・文化団体2016:0.4693

[稼ぐ力]政治・経済・文化団体2016:0.432

貯蓄現在高のジニ係数(二人以上の世帯のうち勤労者世帯)2014:0.417

[雇用力]銀行業2016:0.3964

[稼ぐ力]銀行業2016:0.3933

学業の平均時間(無業者)(女)2016:0.3929

[稼ぐ力]保険業(保険媒介代理業,保険サービス業を含む)2016:0.3878

飲食店数(人口千人当たり)2016:0.3868

・・・・・・・

[雇用力]倉庫業2016:-0.4178

水質汚濁防止法上の特定事業場数2016:-0.4204

[雇用力]鉄道業2016:-0.4317

製造業事業所敷地面積2017:-0.4327

精神科病院数(公立医療機関)2016:-0.4595

旅行・行楽行動者率(10歳以上)2016:-0.465

[稼ぐ力]鉄道業2016:-0.483

[稼ぐ力]非鉄金属製造業2016:-0.4843

[稼ぐ力]倉庫業2016:-0.4959

行楽行動者率(10歳以上)2016:-0.5161

[雇用力]道路貨物運送業2016:-0.544

[稼ぐ力]道路貨物運送業2016:-0.5785

第四次産業がジニ係数を大きくし、第二次産業が格差を小さくします。貨物運送業や倉庫業は第四次産業のようですが製造物の運搬や保存のため製造業と同じ挙動と考えます。(定義が曖昧かもしれません。)旅行・行楽行動者率がなぜ製造業に色分けしているかは製造業従事者の特徴としてそれがあるからです。後で詳述します。温暖化の犯人で製造工場を上げましたが、格差を防ぐためには第二次産業=製造業は重要なのです!完全失業率を下げ、収入を上げるには製造業が重要なのです!次に「実収入」を見てみます。

大分野」→「企業・家計・経済」、「小分野」→「実収入(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014」。

<結果です>

経常収入(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.9978

可処分所得(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.9938

勤め先収入(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.9588

実支出(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.9173

非消費支出(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.9111

消費支出(二人以上の世帯)(全国消費実態調査)2014:0.88

消費支出(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.8793

貯蓄現在高(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.8501

パソコン(ノート型)の1000世帯当たり所有数量(二人以上の世帯のうち勤労者世帯)2014:0.8266

預貯金(通貨性+定期性)(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.8222

温水洗浄便座の1000世帯当たり所有数量(二人以上の世帯)2014:0.8135

食料(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.8126

・・・・・・・

テレビ・ラジオ・新聞・雑誌の平均時間(10歳以上)(男)2016:-0.5694

[雇用力]道路旅客運送業2016:-0.5858

[稼ぐ力]飲食料品卸売業2016:-0.5917

離職率2017:-0.6137

[雇用力]飲食料品卸売業2016:-0.6237

貯蓄現在高のジニ係数(二人以上の世帯のうち勤労者世帯)2014:-0.6726

完全失業率(国勢調査)2015:-0.6962

貯蓄現在高のジニ係数(二人以上の世帯)2014:-0.7199

収入に依存して所有数も増えるし支出も増えるのでそこは置いておきます。ジニ係数や完全失業率と実収入負の相関=収入が上がると格差が小さくなることを示しています。そして稼ぐ力の中で実収入と一番相関が高いのは・・・

[稼ぐ力]その他の製造業2016:0.6006

[稼ぐ力]プラスチック製品製造業(別掲を除く)2016:0.5898

[稼ぐ力]生産用機械器具製造業2016:0.5855

[稼ぐ力]金属製品製造業2016:0.5671

[稼ぐ力]電気機械器具製造業2016:0.5406

[稼ぐ力]はん用機械器具製造業2016:0.5294

[稼ぐ力]鉄道業2016:0.4956

[稼ぐ力]非鉄金属製造業2016:0.4885

[稼ぐ力]印刷・同関連業2016:0.4325

・・・・・・

製造業なのです。つまり少なくとも2016年まで日本では製造業が収入を支えており、富の分配がうまくいっていたので格差が少なかったということです。しかし、新興産業である第四次産業の出現とコロナ禍で加速したこの”非対面のサービス業”の隆盛はますます格差を増大させると思われます。この非対面サービス業と定義した第四次産業とは具体的にどんな業種でしょう?そしてこれによって生じた(加速した?)格差をどのように解消できるか?を考えます。


<第四次産業について>

別のサイト「『稼ぐ力』を産業別にみる!」http://riepnyo-homepage.babyblue.jp/tokeiinsi2.htmlでは「大分野」→「その他」、「小分野」→一次産業「[稼ぐ力]農業」二次産業「[稼ぐ力]プラスチック製品製造業」三次産業「[稼ぐ力]飲食店」をメインとした因子分析です。農業の反対方向に飲食店があり、プラスチック製造業の反対方向に国家公務があるのがわかります。はじめは四次産業の存在を仮定せず因子分析すると、三次産業の中で二次産業の真逆にある項目が目につき、その性質は「人口の密集(都市部)と相関はないサービス業であること」に気づきました。三次産業の多くは人口関係の項目と相関があったからです。飲食店などのサービス業は「企業・家計・経済」→「県内総生産額(宿泊・飲食サービス業)(2011年基準)2015」で相関を調べると、人口と相関がある項目と強い相関がある事(0.9以上)が分かります。今までのイメージのサービス業である飲食店、学習塾、服飾店などいわゆる店は人口の密集=人と対面してサービスを提供することを必要としましたが、オンラインで完結したり、人と対面せずに成り立つサービス事業(国家公務など昔からあったのですが)の隆盛はインターネットの普及によって可能になった近年の出来事です。近年にいたる設備環境の変化が新たな産業の特徴を際立たせて四次産業と名付けてもいいぐらいの産業規模になったと思います。代表的な四次産業は国家公務、道路旅客運送業、飲食料品卸売業、映像・音声・文字情報制作業、広告業、インターネット附随サービス業などと考えます。

(*)因子分析する項目が増えれば増えるほどクラス分けが難しくなるので特徴的な少数の項目でやるとより分かりやすいです。「稼ぐ力を産業別にみる!」で「項目を増やす」ボタンでいろんな項目の因子分析を見れます。そのあと作った「選んだ項目を因子分析する!」http://riepnyo-homepage.babyblue.jp/tokeiinsi3.htmlでは自分で自由に項目を選んで因子分析できるので試してみてください。

<格差を解消するには?>

単純には製造業の「稼ぐ力」を上げればいいということですが、「稼ぐ力」とは「ある地域のある産業の従事者比率を日本全体のその産業の従事者比率で割った値(特化係数)を輸出入額で調整し(=修正特化係数),対数変換した値」という定義なので、製造業の従業者比率を上昇させ製造業に特化させればいいということです。製造業を盛んにすることで工場を増やすと温室効果ガスも増やしてしまうので、何とかそれ以外の産業で格差を解消できればいいのですが。思いついた方法としては一定規模の収入に対して従業者規定数以上を規定以上の給料で雇用することを義務付けるとか?課税するよりも、国に取られたという意識がなくなる気はします。従業者に適切な仕事を与えようが与えまいが規定額以上の給料さえ支払えば雇う側の自由ということで。とりあえず誰かを雇わなければならないとなったら、追従者も増え王様気分も味わえるでしょうし富の分配がストレスなく起こるかなと。奴隷制みたいになるかしら?とちょっと思いましたが・・・・。

<製造業の稼ぐ力が格差をなくすというがそのどの部分が効いてるの?(めも)>

Q.従業者数がほかの産業よりも製造業で多いんじゃないの?(で給料がみな同じ)

A.いいえ。従業者数は三次産業従事者との相関が0.97だったので従業者はほぼ三次産業従事者。(従業者数の増減は三次産業従事者数の増減と一致している)

Q.製造業の従業者数が多ければ多くの人が給料をもらえるので格差は下がる?

A.いいえ。製造業の従業者数と年間収入のジニ係数はー0.24で相関がない。農業。林業とは-0.3442、サービス業(ほかに分類されないもの)とは0.339。で従業者数は農業、林業では格差解消方向、サービス業では格差増大方向にはたらく。

Q.売上金額が製造業で多いので分配も多いのでは?

A.いいえ。製造業の売り上げ金額とジニ係数(年間収入)の相関はー0.3174で微妙にしか相関がない。

Q.付加価値が高いほうが格差解消にいいのでは?

A.いいえ。製造業の付加価値額と年間収入のジニ係数は-0.253 で相関がないといえる。

Q.県内総生産(製造業)とジニ係数は?

A.年間収入のジニ係数が-0.255 とほぼ相関はない。

→というわけで製造業の”稼ぐ力”が重要!!つまり製造業従業者比率が全従業者の中で高いことが格差を解消する。他の産業ではこれはない。製造業従事者の給料は平均がほかの産業よりも高いし同じ給料の人が多い。(実収入がジニ係数と逆相関なので)。他の産業は給料のばらつきが大きい。だから格差を解消するには収入が高いものから取って分配するしかない。”サービス製造業”という産業にする。

<次のテーマは「行動から性格を占う!」です。>

さてあなたは次のうちどの行動が一番好きですか?

①ボランティア

②スポーツ

③海外旅行

④国内旅行

⑤行楽

⑥学習・自己啓発・訓練

⑦趣味・娯楽

⑧テレビ・ラジオ・新聞・雑誌

<占った結果>

①ボランティアを選んだあなたは・・・・広々とした自然と一軒家の多い田舎に住み勤勉で他人に頼らない自立的な人です。

②のスポーツを選んだあなたは・・・・フットワークが軽く、騒がしいところに住み、引っ越しが多く享楽的で睡眠時間を削ってでもいろいろなことをしたい人です。

③海外旅行を選んだあなたは・・・・裕福な場所に住み教育熱心で研究心に富み、学歴が高くあまり働かない人です。

④国内旅行を選んだあなたは・・・・娯楽や衣服や食料や旅行や行楽など出費が多く、忙しくするのが好きな人です。

⑤行楽を選んだあなたは・・・・旅行も好きでパソコンや衣服やビデオカメラなど物を買うのも好きで、勤勉で貯蓄もしっかりして周囲と同じぐらいの生活水準が好きな人です。

⑥学習・自己啓発・訓練を選んだあなたは・・・・スポーツも好きで、新しいものや新しい場所を体験するのも好きで教育熱心で都会に住み田舎はあまり好きじゃない人です。

⑦趣味・娯楽を選んだあなたは・・・・博物館に行くのが好きで知識への欲求が強く、湿度が低いところに住んでいる真面目でやさしい堅実な人です。

⑧テレビ・ラジオ・新聞・雑誌を選んだあなたは・・・・労働が多く肉体を酷使していて、よく寝て、田舎だけど忙しくて家賃が安い地域に住んでいて出費もせず職場が近い人です。

当たってましたか?それぞれ「大分野」→「教育・スポーツ・生活」、「小分野」→「○○○行動者率(10歳以上)2016」で相関係数を求めた結果から上の占いを作りました。

とくに「行楽行動者率」は

旅行・行楽行動者率(10歳以上)2016:0.945

旅行行動者率(10歳以上)(男)2016:0.844

国内旅行行動者率(10歳以上)2016:0.8125

温水洗浄便座の1000世帯当たり所有数量(二人以上の世帯)2014:0.8089

旅行行動者率(10歳以上)2016:0.8049

パソコン(ノート型)の1000世帯当たり所有数量(二人以上の世帯)2014:0.78

[稼ぐ力]プラスチック製品製造業(別掲を除く)2016:0.7774

消費支出(二人以上の世帯)(全国消費実態調査)2014:0.77

パソコン(ノート型)の1000世帯当たり所有数量(二人以上の世帯のうち勤労者世帯)2014:0.7599

・・・・・・・

製造業が上位に出てくるので製造業従事者に特徴的だと判断しました。

<それぞれの判断の根拠の相関係数を表示してみます>

①ボランティア

「大分野」→「教育・文化・スポーツ・生活」、「小分野」→「ボランティア活動行動者率(10歳以上)2016」を選びます。

まちづくりのためのボランティア活動行動者率(10歳以上)2016:0.9197

自然や環境を守るためのボランティア活動行動者率(10歳以上)2016:0.9053

高齢者を対象としたボランティア活動行動者率(10歳以上)2016:0.8103

子供を対象としたボランティア活動行動者率(10歳以上)2016:0.7725

スポーツ・文化・芸術・学術に関係したボランティア活動行動者率(10歳以上)2016:0.7594

安全な生活のためのボランティア活動行動者率(10歳以上)2016:0.7242

自動車の1000世帯当たり所有数量(二人以上の世帯)2014:0.6707

自動車の1000世帯当たり所有数量(二人以上の世帯のうち勤労者世帯)2014:0.6585

1住宅当たり居住室数2013:0.6147

[稼ぐ力]窯業・土石製品製造業2016:0.6103

 1住宅当たり延べ面積2013:0.6007

一般世帯の一世帯当たり人員2015:0.5854

[雇用力]電子部品・デバイス・電子回路製造業2016:0.5711

[雇用力]窯業・土石製品製造業2016:0.5686

[稼ぐ力]電子部品・デバイス・電子回路製造業2016:0.5567

仕事の平均時間(無業者)(女)2016:0.5522

1住宅当たり居住室の畳数2013:0.5269

[稼ぐ力]協同組合(他に分類されないもの)2016:0.5266

ハイブリッド・電気自動車国産の1000世帯当たり所有数量(二人以上の世帯)2014:0.5224

1住宅当たり敷地面積2013:0.5159

・・・・・・・ 

生活保護扶助世帯数2016:-0.6023

生活保護扶助世帯数(生活)2016:-0.6035

母子世帯数(子供が1人)2015:-0.6045

保護開始世帯数(高齢者世帯)2016:-0.6045

福祉事務所生活保護申請件数2016:-0.6047

現に保護を受けた生活保護被保護実世帯数(傷病・障害者世帯)2016:-0.6048

[雇用力]不動産賃貸業・管理業2016:-0.6049

生活保護被保護実世帯数2016:-0.6054

児童扶養手当受給者数2016:-0.6054

現に保護を受けた生活保護被保護実世帯数2016:-0.6054

生活保護扶助世帯数(介護)2016:-0.6075

医療施設推計外来患者数(脳血管疾患)(施設所在地)2017:-0.6132

医療施設推計外来患者数(脳血管疾患)(患者住所地)2017:-0.6138

家族従業者数(就業構造基本調査)2017:-0.6231

 

広々とした自然一軒家の多い田舎に住み勤勉で他人に頼らない自立的な人です。

②スポーツ

「大分野」→「教育・文化・スポーツ・生活」、「小分野」→「スポーツ行動者率(10歳以上)2016」を選びます。

人口増減率2016:0.8273

海外旅行行動者率(10歳以上)2016:0.8237

課税対象所得(納税義務者1人当たり)2016:0.7962

教養娯楽関係費(二人以上の世帯)(全国消費実態調査)2014:0.7884

教養娯楽サービス(二人以上の世帯)(全国消費実態調査)2014:0.784

転入超過率(日本人移動者)2016:0.7831

教養娯楽サービス(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7753

転入超過率(外国人含む)2016:0.7749

教養娯楽(二人以上の世帯)(全国消費実態調査)2014:0.7711

教養娯楽関係費(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7685

教養娯楽(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7641

世帯主の勤め先収入(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7614

通勤・通学の平均時間(10歳以上)(男)2016:0.7526

2次活動の平均時間(無業者)(女)2016:0.7502

教育(二人以上の世帯)(全国消費実態調査)2014:0.7489

学習・自己啓発・訓練行動者率(10歳以上)2016:0.7452

タブレット端末の1000世帯当たり所有数量(二人以上の世帯)2014:0.7437

旅行行動者率(10歳以上)2016:0.7416

専用住宅の1畳当たり家賃2013:0.7325

自然増減率(人口千対)2016:0.7317

国内旅行行動者率(10歳以上)2016:0.7285

国際協力に関係したボランティア活動行動者率(10歳以上)2016:0.7284

・・・・・・・・・・ 

フットワークが軽く、騒がしいところに住み引っ越しが多く享楽的で睡眠時間を削ってでもいろいろなことをしたい人です。

③海外旅行

「大分野」→「教育・文化・スポーツ・生活」、「小分野」→「海外旅行行動者率(10歳以上)2016」を選びます。

課税対象所得(納税義務者1人当たり)2016:0.9466

地域別最低賃金2016:0.8948

専用住宅の1畳当たり家賃2013:0.8917

通勤・通学の平均時間(10歳以上)(男)2016:0.8809

教育(二人以上の世帯)(全国消費実態調査)2014:0.8701

通勤・通学の平均時間(有業者)(男)2016:0.8686

他市区町村への通勤者比率2015:0.8659

教育(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.8615

通勤・通学の平均時間(10歳以上)(女)2016:0.8565

タブレット端末の1000世帯当たり所有数量(二人以上の世帯)2014:0.8426

標準価格(平均価格)(住宅地)2016:0.8416

他市区町村への通勤者数2015:0.8413

就業者・通学のかたわら仕事(国勢調査)2015:0.8413

一般旅券発行件数2016:0.8398

図書館登録者数2014:0.8363

教養娯楽サービス(二人以上の世帯)(全国消費実態調査)2014:0.8336

教養娯楽関係費(二人以上の世帯)(全国消費実態調査)2014:0.831

労働者派遣事業所の派遣社員(国勢調査)2015:0.8266

高等学校卒業者のうち大学進学者数2016:0.8262

高校生の進学率2016:0.8259

帰国者数(短期滞在を除く)(日本人・男)2016:0.8257

転出者数(外国人含む)(男)2016:0.8256

出国者数(短期滞在を除く)(日本人・男)2016:0.8255

財政力指数(都道府県財政)2016:0.8246

転出者数(外国人含む)2016:0.8242

スポーツ行動者率(10歳以上)2016:0.8237

当該県の高校出身者である大学入学者数2016:0.8234

高等学校卒業者の進学希望者数(新規高卒者)2016:0.8233

転出者数(外国人含む)(女)2016:0.8217

・・・・・・

[稼ぐ力]農業2016:-0.8554

労働日数2016:-0.8887

裕福な場所に住み教育熱心で研究心に富み学歴が高くあまり働かない人です。

④国内旅行

「大分野」→「教育・文化・スポーツ・生活」、「小分野」→「国内旅行行動者率(10歳以上)2016」を選びます。

旅行行動者率(10歳以上)2016:0.9991

旅行行動者率(10歳以上)(男)2016:0.9891

旅行・行楽行動者率(10歳以上)2016:0.9433

教養娯楽関係費(二人以上の世帯)(全国消費実態調査)2014:0.861

教養娯楽サービス(二人以上の世帯)(全国消費実態調査)2014:0.859

被服及び履物(二人以上の世帯)(全国消費実態調査)2014:0.8567

教養娯楽(二人以上の世帯)(全国消費実態調査)2014:0.8472

教養娯楽サービス(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.8472

教養娯楽関係費(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.8456

世帯主の勤め先収入(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.8397

教養娯楽(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.8321

食料(二人以上の世帯)(全国消費実態調査)2014:0.8279

消費支出(二人以上の世帯)(全国消費実態調査)2014:0.8145

被服及び履物(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.8129

行楽行動者率(10歳以上)2016:0.8125

パソコン(ノート型)の1000世帯当たり所有数量(二人以上の世帯)2014:0.8078

海外旅行行動者率(10歳以上)2016:0.7909

課税対象所得(納税義務者1人当たり)2016:0.7859

地域別最低賃金2016:0.7835

食料(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7796

教育(二人以上の世帯)(全国消費実態調査)2014:0.7787

財政力指数(都道府県財政)2016:0.7772

・・・・・・・・ 

 睡眠の平均時間(10歳以上)(男)2016:-0.691

テレビ・ラジオ・新聞・雑誌の平均時間(有業者)(男)2016:-0.6996

小売店数(人口千人当たり)2016:-0.7078

[稼ぐ力]地方公務2016:-0.7156

[雇用力]地方公務2016:-0.7179

労働日数2016:-0.7656

娯楽や衣服や食料や旅行や行楽など出費が多く、忙しくするのが好きな人です。

⑤行楽

「大分野」→「教育・文化・スポーツ・生活」、「小分野」→「行楽行動者率(10歳以上)2016」を選びます。

旅行・行楽行動者率(10歳以上)2016:0.945

旅行行動者率(10歳以上)(男)2016:0.844

国内旅行行動者率(10歳以上)2016:0.8125

温水洗浄便座の1000世帯当たり所有数量(二人以上の世帯)2014:0.8089

旅行行動者率(10歳以上)2016:0.8049

パソコン(ノート型)の1000世帯当たり所有数量(二人以上の世帯)2014:0.78

[稼ぐ力]プラスチック製品製造業(別掲を除く)2016:0.7774

消費支出(二人以上の世帯)(全国消費実態調査)2014:0.77

パソコン(ノート型)の1000世帯当たり所有数量(二人以上の世帯のうち勤労者世帯)2014:0.7599

被服及び履物(二人以上の世帯)(全国消費実態調査)2014:0.7468

勤め先収入(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7444

実支出(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7378

被服及び履物(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7349

ビデオカメラの1000世帯当たり所有数量(二人以上の世帯)2014:0.7332

預貯金(通貨性+定期性)(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7297

[稼ぐ力]非鉄金属製造業2016:0.7295

貯蓄現在高(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7257

世帯主の勤め先収入(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7242

実収入(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7241

教養娯楽(二人以上の世帯)(全国消費実態調査)2014:0.7211

教養娯楽(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7198

消費支出(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7195

経常収入(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7142

可処分所得(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7087

食料(二人以上の世帯)(全国消費実態調査)2014:0.7085

非消費支出(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.7005

教養娯楽サービス(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.6979

預貯金(通貨性+定期性)(二人以上の世帯)(全国消費実態調査)2014:0.6976

[稼ぐ力]生産用機械器具製造業2016:0.6949

教養娯楽サービス(二人以上の世帯)(全国消費実態調査)2014:0.6915

貯蓄現在高(二人以上の世帯)(全国消費実態調査)2014:0.6858

教養娯楽関係費(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.6847

食料(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.6835

・・・・・・・・・

旅行も好きパソコンや衣服やビデオカメラなど物を買うのも好きで、勤勉貯蓄もしっかりして周囲と同じぐらいの生活水準が好きな人です。


⑥学習・自己啓発・訓練

「大分野」→「教育・文化・スポーツ・生活」、「小分野」→「学習・自己啓発・訓練行動者率(10歳以上)2016」を選びます。

学習・自己啓発・訓練行動者率(10歳以上)2016:1

学習・自己啓発・訓練の平均時間(学業以外)(10歳以上)(女)2016:0.8647

学習・自己啓発・訓練の平均時間(学業以外)(10歳以上)(男)2016:0.7902

学習・自己啓発・訓練の平均時間(学業以外)(無業者)(女)2016:0.7682

スポーツ行動者率(10歳以上)2016:0.7452

タブレット端末の1000世帯当たり所有数量(二人以上の世帯)2014:0.7358

海外旅行行動者率(10歳以上)2016:0.73

教育(二人以上の世帯)(全国消費実態調査)2014:0.696

[稼ぐ力]飲食店2016:0.6812

課税対象所得(納税義務者1人当たり)2016:0.6797

[雇用力]飲食店2016:0.678

教育(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.6729

育児の平均時間(10歳以上)(女)2016:0.668

人口増減率2016:0.6654

学習・自己啓発・訓練の平均時間(学業以外)(有業者)(女)2016:0.6646

学習・自己啓発・訓練の平均時間(学業以外)(有業者)(男)2016:0.66

学習・自己啓発・訓練の平均時間(学業以外)(無業者)(男)2016:0.6583

高校生の進学率2016:0.6573

自然増減率(人口千対)2016:0.6566

通勤・通学の平均時間(10歳以上)(女)2016:0.6541

地域別最低賃金2016:0.6529

教養娯楽サービス(二人以上の世帯)(全国消費実態調査)2014:0.6511

教養娯楽関係費(二人以上の世帯)(全国消費実態調査)2014:0.6501

通勤・通学の平均時間(10歳以上)(男)2016:0.6473

通勤・通学の平均時間(有業者)(男)2016:0.6468

他市区町村への通勤者比率2015:0.6446

新規就業率2017:0.6365

有価証券(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.6361

[稼ぐ力]不動産取引業2016:0.6338

[雇用力]その他の教育,学習支援業2016:0.6333

[稼ぐ力]その他の教育,学習支援業2016:0.6271

就業異動率2017:0.6258

教養娯楽サービス(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.6231

任意自動車保険普及率(搭乗者傷害)2016:0.6183

教養娯楽関係費(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.6183

客室稼働率2016:0.6171

・・・・・・

 [雇用力]廃棄物処理業2016:-0.6711

死亡率(人口千対)2016:-0.7004

労働日数2016:-0.709

睡眠の平均時間(有業者)(男)2016:-0.7234

睡眠の平均時間(10歳以上)(男)2016:-0.7525

[雇用力]総合工事業2016:-0.7693

[稼ぐ力]総合工事業2016:-0.7769

スポーツも好きで、新しいものや新しい場所を体験するのも好きで教育熱心都会に住み田舎はあまり好きじゃない人です。


⑦趣味・娯楽

「大分野」→「教育・文化・スポーツ・生活」、「小分野」→「趣味・娯楽行動者率(10歳以上)2016」を選びます。

趣味・娯楽の平均時間(10歳以上)(女)2016:0.775

趣味・娯楽の平均時間(有業者)(男)2016:0.688

趣味・娯楽の平均時間(有業者)(女)2016:0.6828

趣味・娯楽の平均時間(10歳以上)(男)2016:0.6826

消費者物価地域差指数(教養娯楽)2016:0.5884

趣味・娯楽の平均時間(無業者)(女)2016:0.5783

公立博物館数2015:0.5767

博物館数2015:0.5736

パソコン(デスクトップ型)の1000世帯当たり所有数量(二人以上の世帯)2014:0.5471

高校生の進学率2016:0.545

被服及び履物(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.5371

地域別最低賃金2016:0.5293

教養娯楽関係費(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.5266

教養娯楽サービス(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.5234

神道系信者数2016:0.5212

身体障害者社会参加支援施設数2016:0.4943

旅行行動者率(10歳以上)2016:0.4941

博物館職員数2015:0.4919

教養娯楽(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)2014:0.4892

国内旅行行動者率(10歳以上)2016:0.4884

公営企業等会計部門職員数2016:0.4839

・・・・・・・

[雇用力]総合工事業2016:-0.4876

[稼ぐ力]総合工事業2016:-0.4958

年平均相対湿度2016:-0.5172

仕事の平均時間(有業者)(女)2016:-0.5281

博物館に行くのが好きで知識への欲求が強く湿度が低いところに住んでいる真面目でやさしい堅実な人です。


⑧テレビ・ラジオ・新聞・雑誌

「大分野」→「教育・文化・スポーツ・生活」、「小分野」→「テレビ・ラジオ・新聞・雑誌行動者率(10歳以上)2016」を選びます。

テレビ・ラジオ・新聞・雑誌の平均時間(有業者)(男)2016:0.7864

テレビ・ラジオ・新聞・雑誌の平均時間(10歳以上)(男)2016:0.7363

労働日数2016:0.7357

[稼ぐ力]農業2016:0.7172

テレビ・ラジオ・新聞・雑誌の平均時間(10歳以上)(女)2016:0.6989

[稼ぐ力]協同組合(他に分類されないもの)2016:0.691

テレビ・ラジオ・新聞・雑誌の平均時間(無業者)(女)2016:0.6855

死亡率(人口千対)2016:0.6833

テレビ・ラジオ・新聞・雑誌の平均時間(有業者)(女)2016:0.6795

[稼ぐ力]水産養殖業2016:0.6626

[稼ぐ力]その他の小売業2016:0.6608

[雇用力]その他の小売業2016:0.6558

小売店数(人口千人当たり)2016:0.6545

[稼ぐ力]自動車整備業2016:0.6336

[雇用力]協同組合(他に分類されないもの)2016:0.6146

[稼ぐ力]総合工事業2016:0.6118

[雇用力]農業2016:0.6044

[稼ぐ力]林業2016:0.6023

[稼ぐ力]地方公務2016:0.6016

[稼ぐ力]機械器具小売業2016:0.5935

睡眠の平均時間(10歳以上)(男)2016:0.5897

[稼ぐ力]郵便局2016:0.586

・・・・・

標準価格(平均価格)(住宅地)2016:-0.7329

住宅・土地のための負債(二人以上の世帯)(全国消費実態調査)2014:-0.7352

教育(二人以上の世帯)(全国消費実態調査)2014:-0.74

高校生の進学率2016:-0.7455

地域別最低賃金2016:-0.752

タブレット端末の1000世帯当たり所有数量(二人以上の世帯)2014:-0.7527

海外旅行行動者率(10歳以上)2016:-0.7626

課税対象所得(納税義務者1人当たり)2016:-0.7875

専用住宅の1畳当たり家賃2013:-0.7958

労働が多く肉体を酷使していてよく寝て田舎だけど忙しくて家賃が安い地域に住んでいて出費もせず職場が近い人です。


2021年6月16日水曜日

都道府県の統計を使って色々してみた

統計ダッシュボードさんからダウンロードした47都道府県の色々なデータを使ってやってみました。
*47都道府県を47個のデータとして扱いました。
①統計で占う!↓です!!
http://riepnyo-homepage.babyblue.jp/tokeikankei.html
*重回帰分析を使って、目的変数、例えば「実収入」を説明変数、例えば「実収入」「温水洗浄暖房便座」「ボランティア活動行動者率」などを使って予想します。
*説明変数の数値を変化させて「計算実行」してみると「実収入」が上がったり下がったりします。
*自分の行動によって「実収入」がどれくらい変化するのかを占えます。
*目的変数には
実収入▼
1日一人当たりのごみ排出量▼
健康寿命(女)▼
健康寿命(男)▼
外来患者延数(精神科病院)▼
1人当たり最終エネルギー消費量▼
献血者数▼
可処分所得(二人以上の世帯のうち勤労者世帯)(全国消費実態調査)▼
学習・自己啓発・訓練行動者率(10歳以上)▼
覚せい剤取締検挙件数▼
が選べます。


②都道府県の統計を予想する

*グラフを見て最新の年の値を0~1で予測し、「重回帰分析」の予測とどっちが近いかを競います!!
*掛け点と倍率を自分で設定できるので自信のある予想では多く掛けたり調節して、「重回帰分析」予想に勝利してみてください!!
*自分の持ち点10点を使って「重回帰分析」の予想を見ることができます。
*実際の統計データを使っているので多少勉強(?)にもなるかなと。








③地方自治財政を推定
・地方自治財政の最新の年の「歳出」を変更して翌年の「歳入アップ率」「実質収支比率」「財政力指数」「自主財源額」「経常収支比率」「地方債現在高」の6項目の ランキングですべて1位を取れたら成功です。
・1976年から2017年までです。
・「▼歳出」のグラフで変更したい項目をクリックするとスライダーがでるのでそれを動かして歳出を決めてください。
・「元に戻す」で変更を戻せます
・「推測する!」で変更に基づいた次の年の項目を推測して表示します。
・「実際の次の年」は変更は無視された実際の年のデータを表示します。
・初めからする場合は好きな都道府県を選んで「はじめから」を押してください。何も選ばなければランダムで選ばれます。
*地方自治で変化させられるものといえば歳出の配分ぐらいかなと思って作りました。
*税収の多い自治体と少ない自治体は何が違うのか?とかどうすれば地方と都市の格差がなくせるのか?そもそもなくさなくてもいいのか?とか考えながらやったらおもしろいかなと思いました。



④「稼ぐ力」を産業別にみる!
*一次産業「農業」、二次産業「製造業」、三次産業「サービス業」と分けますが、これらの「稼ぐ力」にどのような相関があるのか?と思って作りました。

*結果は一次産業と三次産業は稼ぐ力に逆の相関があり、二次産業はそれらに無関係であると言えました。つまり、農業の稼ぐ力が大きい都道府県ではサービス業で稼ぐ力が小さいということで、製造業はそれに関係がないということです。

*農業、製造業、サービス業といっても細かく分けられるので、製造業はプラスチック製品製造業とか、サービス業では飲食店、不動産取引業とか、細かい項目も一気に因子分析すると、相関が近い項目がグループになって、林業が一次産業に近いのだなとか、行楽行動者率が製造業に近いのだなとか面白いのでやってみました。






⑤自由に選んだ項目を因子分析する!
④の項目を自分で選びたいなということで作りました。

*因子分析は相関が近いものをグループにして、グループどうしがどのような関係にあるか?がわかるから面白いので、自分で項目を選べて、勝手に相関が近いやつを選んでくれてグループにしてくれて、項目がどこのグループに入っててどんな関係か?がわかれば面白いなということで作りました。

*四次産業とは何か?がわかりました。











⑥行動を変化させ生活のランキングを上げる!
*各都道府県を個人と見立てて1979年から2017年まで行動して過ごして他のプレーヤー(自動計算)と得点を競います。
*変更できる行動は「支出」と「活動時間」だけです。
*得点は「収入・負債・貯蓄」や「所有物」「旅行」「病気」「労働時間」「家事・民事事件」で競います。
*はじめにどの都道府県を選ぶか?でも結構決まります。
*都市(東京とか、大阪とか)からはじめるのがいい部分もあれば悪い部分もありますので、なかなか面白いです。
*自分は収入さえよければいい!と思えるなら都市部スタートでいいと思いますが、総合得点のランキング1位を目指すにはどうでしょう?








⑦自分に合う都道府県を探す
*結局自分に合う都道府県ってどこなの?と思ってそれを統計から探せるようにしました。

*大きいほうがいい項目(例えば実収入)と小さいほうがいい項目(例えば犯罪)とを選んで「実行」するとランキングの和が小さい県を探します。凶悪犯検挙件数2016は1位が鳥取県2位が富山県・・・・とかがわかります。

*ちなみに自分は自分の都道府県があってました!!





⑧2016年付近の項目の相関係数を求める
*どの項目がどの項目とどれくらいの相関係数で相関があるかを知りたい場合に使えます。
*2016年付近の47都道府県の値どうしで相関をとっています。
*相関係数が1に近いほど相関があり、0に近いほど相関がありません。-1は逆の相関があります。
*相関係数が大きい順にすべて表示しています。
*文字列検索にたとえば「人口」といれると、「人口」を含む項目だけが表示されます。(「15歳以上人口」「総人口」・・・など)



⑨重回帰式を使って温室効果ガスと平均気温の原因をグラフで感じる

・重回帰分析で 「温室効果ガス」を目的変数にして、その他適当に選んだ31項目を説明変数にして重回帰分析すれば、どの項目をどれくらい増減させれば「温室効果ガス」が減らせるのか?が 直観的に理解できると思いました。
・ついでに、「1項目の目的変数その他31項目の説明変数」の重回帰式を32項目すべてで求めて、説明変数の項目を増減させたとき目的変数の項目がどう変化するかを グラフで見えるようにしました。
・標準偏回帰係数が大きいほど目的変数に大きい影響があるということで、0に近いほどあまり影響がないということです。
*例えば、ごみ総排出量を50から60に増やしたとき
右図のように都市ガス販売量が63になって実収入が32になるというようにどんな変化が起こるかを直観できます。「温室効果ガス」は43と減少していて、これは一見正しいのかな?と疑問に思いますが、温室効果ガスのグラフの棒をクリックして「標準偏回帰係数」をクリックしてみてみると「-0.6838223775835431:司法・安全・環境/ごみ総排出量(総量)」なので、ごみ総排出量は負の影響を与える→温室効果ガスを減少させることになります。この結果は直観に反しているように見えますし、重回帰分析の際は互いに相関が小さい項目を選ぶべしとあるので、互いに相関が大きい項目を選んでいるかもしれませんが、温室効果ガスを目的変数とした重回帰式の決定係数が「0.94875146:決定係数(1に近いほど、回帰式が実際のデータに当てはまっている)」なのでこの回帰式の正しさは十分と考えられます。
*各都道府県と年を指定してはじめの値をクリックすると、その年のその県の各項目偏差値(平均を50、標準偏差を10としたもの)がわかります。それを変化させてみることもできます。
*「▼課題を見てみる」に具体的に目安を設定しました。温室効果ガスやごみ処理量や平均気温を増やさず、収入や賃金を上げることができるか?を試してみてクリアしてみてください。自分でやってみるとどう行動すべきかがちょっとわかったような気がします。

2021年6月13日日曜日

語句の特徴を使って色々してみた

 <語句の特徴>とは、テンソルフローのword2vec を使って取得した語句のembeddingsのことで、[1,128]のベクトル。

・これがわかれば語句どうしの近さや遠さがわかるので、文章の特徴も現わせるのではないかと考えた。

・文章の特徴がわかれば作品の特徴や作者の特徴もわかるのではないかと考えた。

・作品の特徴がわかれば似ている作品を探すのに便利だなと。

・語句の特徴の配列から続く語句を予想できれば続きの文をつくれるかなと。

<やったこと>

①テキストボックスに入力した文章から文豪を判定する。

「文豪判定」のリンクです↓。

http://riepnyo-homepage.babyblue.jp/bungohantei.html

・こんな感じのページです→

・自分で好きな事を書いて、それがある文豪の書くことと似てると、この人と考え方が似てるのかなと親近感がわきます!





②テキストボックスに入力した文章に題名を付ける。

「自動で作品に題名を付けてみる」のリンクです↓。

http://riepnyo-homepage.babyblue.jp/daimeituke.html


・こんな感じのページです→


・題名を付けると自分の文章が結局何が言いたかったのかが明らかになります!



③テキストボックスに入力した文章に似た作品を探す。

*似た作品を探せるリンクです↓↓。

「自動で作品に題名を付けてみる」で、’好きな作品として登録!’して’文豪作品から好きな作品の上位ゲット’をすると似た作品を探せます↓。

http://riepnyo-homepage.babyblue.jp/daimeituke.html

・こんな感じのページです→

・好きな作品として登録すると、書いた文の特徴が、つけた題名で登録され、リストが増えていき、その平均の特徴ににた文豪作品を探します。

・リストは2つ以上登録した場合、その題名をクリックすると消せます。

「メンタルヘルス判定」でも’メンタルヘルス判定’!すると似た作品を探せます↓。

http://riepnyo-homepage.babyblue.jp/mentalfol/mental.html

④テキストボックスに入力した文章からメンタルヘルスのチェックリストの近さを判定

「メンタルヘルス判定」のリンクです↓。

http://riepnyo-homepage.babyblue.jp/mentalfol/mental.html

・こんな感じのページです→

・書いた文(コピペでもOK)を、メンタルヘルスのチェックリストに最も近いメンタル状態に色分けします。

・書いた文に近い特徴の作品を探して下に表示します。

・青空文庫にある作品なのですぐ読めます!

・自分のメンタルが今どんな状態かな?と気軽に知りたいときに参考ぐらいにはなります。


⑤テキストボックスに入力した文章の続きを予測して夏目漱石の作品から続きの文を抜き出す。

「小説の続きをつくりませう」のリンクです↓。

http://riepnyo-homepage.babyblue.jp/natumetuduki.html

・こんな感じのページです→

・入力された文章に似た部分を夏目漱石作品から探して続きを表示します。

・「。」で終わるまでを1文として8文から次の1文を予想します。