前回の先生のコメントより、現状の辞書の標準状態と、自分の研究の拡張状態の精度のある程度の比較目安の提示!
読み取ったリスト
①バロネス・オルツィ、オルツィ②エドガー・アラン・ポー、ポウ、ポゥ
③ジョン・ディクスン・カー、カー④エラリー・クイーン、エラリィ、エラリイ
⑤S・S・ヴァン・ダイン、ヴァン⑥アガサ・クリスティ、アガサ
⑦ガストン・ルルー、ルルウ、ルルゥ
現状のRによる
@固有名詞として読み取れるもの
ポゥ、エラリィ、ヴァン・ダイン、アガサ、ルルゥ
@一般名詞として読み取るもの
バロネス・オルツィ、オルツィ、エドガー・アラン・ポー、ポウ、ジョン・ディクスン・カー、カー、エラリー・クイーン、エラリィ、ヴァン、アガサ・クリスティ、ガストン・ルルー、ルルウ
➡固有名詞つまり名前として読み取れているものが少ない。
フルネームなら読み見とれる、ヴァン・ダインや、フルネームは読み取れず省略系で読み取れる、ポゥ、エラリィ、アガサ、ルルゥと、個別でバラバラの状況であり、全体(推理小説家の名前データ)としてフルネームでも省略系でも読み取れるように拡張することが目標。
➡また、読み取り結果から推理小説家の名前が、辞書に少ないと考えられるので、推理小説家の名前のデータを整備することが有意義といえる。
➡今回の読み取り以外の表現の幅でもRを使って試してみる。
例)エドガー=アラン=ポー
来週から、辞書整備に移る。