・テキストマイニングの基本的な流れ(テキストマイニング入門p37)
→私の研究はどこに着目するか!!!!焦点絞る!!!!
①解決したい問題は何か
②どのようなデータソースが使用できるのか
③どのような前処理とデータの整理が必要なのか(データクリーニング)
④どのデータマイニング手法を使用するのか(どのアルゴリズムを使うのか)
⑤データマイニングでの分析結果をどのように評価するのか
⑥データマイニングから最大限の情報を得るにはどうしたらよいのか
→主に辞書データの作成も含めたデータクリーニング作業のところに着目!!!
・方向性としては、前回先生のアドバイスにもあったようにツイッターや口コミサイト(インタビューデータと言われている?)から得られたつぶやきや評価を用いて「食品に関する製品のテキストマイニング」のデータクリーニングについて? →食品でも企業絞ったほうがやりやすいのか?
・お菓子の辞書の構築というのはもう存在している
https://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=4&ved=0ahUKEwi_m6jBj73NAhVFpZQKHad-AT4QFghOMAM&url=https%3A%2F%2Fweborder.mss.agrex.co.jp%2FABOUT_TERMANAGE_CONFECTIONARY.pdf&usg=AFQjCNELyTZMepq0DNdu5B3JOPRyaJHAPg&cad=rja →だからこそ企業を絞ったほうがいいのか
・この辞書は、1度作ったら終わりではなく、定期的に更新する必要がある。
→ということは、辞書の作成をするだけでは卒論として終わりがないのか
・何かの分析は研究としてダメなのか