11月10日 山本真成美

~形態素解析~

和菓子10種 形態素解析結果
洋菓子10種 形態素解析結果

~参考として~

○Nmecabへの辞書登録について(https://blog.apar.jp/linux/2748/)
→MeCab を使って、文章を単語に分割した時に、複数の単語が含まれる複合語などが、思ったように分割できない事がある。例えば「焼肉定食」は「焼肉」と「定食」の2つの単語に分割されてしまう。MeCab には「最小単位の単語に分割する」という基本ルールがあるため、この分割は正しいのだが、実際に文章を解析する時は、1つの単語として扱いたい!!

○MeCab 辞書への単語の追加方法
辞書への単語の追加には、2つの方法がある。
①システム辞書への追加
→辞書更新が頻繁でないときや, 解析速度を落としたくない時は, 直接 システム辞書を変更するのがよい。
②ユーザ辞書への追加
→システム辞書の更新は時間がかかります. 辞書の更新が頻繁な場合や, システム辞書を変更する権限が無い場合は, ユーザ辞書を作るのがよい。

➡方法については
【https://blog.apar.jp/linux/2748/】や【https://blog.apar.jp/linux/2796/】や【http://taku910.github.io/mecab/dic.html】を参照。

⇒この辞書登録方法を参照にしながら作成したい。

○学習データと検証データについて先生に聞く

○研究目的・研究意義に対して
→長期的なトレンドと絡めて『お菓子の役割』や『お菓子と日本人とのかかわり』を考えていきたいという思いがある(ここで解決しなければいけない課題は何かということをはっきりさせておくと意義が見出しやすい)→手軽に購入できるようになったスナック菓子などの広がりでお菓子をなぜ人が欲するのかという根本的な部分について意識することが減っているように思う(惰性で、売ってあるから買うという考えにいたていないか)→だからそこを明確にすることで日本人とお菓子のかかわりが見えてくる→これでもまだ漠然としているのでどう絞っていけばいいか
⇒お菓子何でも情報館をみて参考にする

○お菓子の役割(お菓子何でも情報館http://www.zenkaren.net/_0800/_0801)

★栄養の補い
・食事の補い
→育ち盛りのお子さんは3度の食事では栄養が不足します。お菓子は楽しみと栄養を補います。時間と量を決めて摂るとよいでしょう。
・疲れの回復
→激しい運動や労働は体力を消耗します。エネルギーの回復には甘いお菓子が役立ちます。
★心の潤い
気分転換、対話、交際、愛情表現、美的感覚、味覚、休息などの仲立ち

→ここにフォーカス!!!!!!!!

○今後の計画(訂正版)
・11月10日→上記のものの形態素解析完成
・11月17,24日→形態素解析の品詞情報を基にキーワードを取り出す
+研究目的・意義発表(大きすぎるテーマの修正)
・12月1.8日→キーワードの出現頻度をヒストグラム化

10月27日 阪口周

前回のせんせいのこめんとより
今週したこと3つ

①先週の名前のリストの文章内での現状の読み取り
②Rの辞書の確認(固有名詞、一般名詞の登録状況)
③外来語の表記ルール、また採用するデータがどのルールに基づくか

①文章内での名前読み取り
使った文章
「第九章 五日目」まででオルツィ、カー、ルルゥ、アガサ、ポゥが殺されてエラリィとヴァンの二人が残り、さらに「第十章 六日目」で十角館が炎上して全員死亡という状況が知らされることで、嫌でもA.クリスティ『そして誰もいなくなった』の結末を連想させられる中、“ヴァン・ダインです”(ノベルス248頁/〈新装改訂版〉402頁)というただ一言で明らかにされる真相は、やはり強烈なインパクトがあります。

読み取り結果

@一般名詞として読み取ったもの
オルツィ、カー、ルルゥ、アガサ、ポゥ、エラリィ、ヴァン、ヴァン・ダイン

@固有名詞として読み取ったもの
クリスティ(A・クリスティとは読み取らない。また人名として表示される。)

②調べたコマンドを入力しているが確認できませんでした。。。

③外来語の表記方法について
扱っている小説自体に表現の揺れがある。
ノベルス版では「ポゥ」「エラリィ」「ルルゥ」と表記されていたが、
文庫化された際に「ポウ」「エラリイ」「ルルウ」と変えられた。
使うつもりのデータは文部科学省が提示するルールと同じだが、ポゥはポー、エラリィはエラリー、ルルゥはルルーであり、データを変える必要がある?

10月27日 仲田杏奈

生駒写真の選定

Facebookページ「まんてんいこま」より写真抜粋

https://www.facebook.com/manten.ikoma/photos/

10%e6%9c%8827%e6%97%a5%e3%82%bc%e3%83%9f

【調査方法】

写真を提示して質問を投げかける。

Q1.以下の写真から最も自然が豊かだと感じるものはどれですか?(選択式)

Q2.なぜそのように感じましたか?(記述式)

?アンケート結果の数を並べて、記述式で得られた回答を羅列する、、で良いのか?

10月27日 谷口美紀

★研究概要

8509485b306031c608c346a1401f7bbd-2-1

★streamingAPI

http://qiita.com/nwsoyogi/items/ab4347a8c3a553747e4f(2016/06/27)

・電話番号の登録が必要@zemisikenyou
→自分のが何らかに登録してあるがどれかわからず……
・ハッシュタグ付き画像付きツイートは取得可能(ハッシュタグ無しで取得するやり方を今のところ見つけられていない)
・1ツイートに複数画像が掲載されていた場合→1枚分しか取得できない$tweet[‘extended_entities’][‘media’]
・キーワードで取得する場合は完全一致でないと×
・どうしたら画像付きツイートが取得できるのか??
RTではなく、画像付きのツイートのみの場合
→if (isset($tweet->user->screen_name) && empty($tweet->retweeted_status)

 

★RestAPI

・キーワード検索だとtwitterAPI1.1のsearch/tweets(画像の取得も可能→filter:images)
・しかし、これも認証が必要
https://syncer.jp/twitter-api-matome/get/search/tweetsより(以下もブログから)
・API1.1では1回のアクセスで100ツイートしか取得できず、アクセスは15分で180回。
・https://api.twitter.com/1.1/search/tweets.json?q=[検索文字]という書き方だと検索できるもののやはりアプリの認証が必要「twitter公式からreate new app」

 

清水寺の緯度経度34.9948561,135.7828576
Entities
クエリ
jsonp