ほの研ブログ - クリスマスワークショップ「日本語の複雑さを評価する」
2013年12月17日(火)に開催されたクリスマス講演会に先だって、クリスマスワークショップ「日本語の複雑さを評価する」が開催されました。以下、少し専門的な内容になりますが、NPO法人ほのぼの研究所の協賛行事として開催しましたので、ここにご報告します。
2013年12月15日(日)10時より18時まで、千葉大学西千葉キャンパス自然科学系総合研究棟1 小会議室において、クリスマスワークショップを開催しました。主催は、科学技術振興機構「大規模会話データに基づく個別適合型認知活動支援」プロジェクト、共催は、「ことば工学研究会」、協賛は、NPO法人ほのぼの研究所です。
ホワイトボードを用いて言語特徴量を検討
認知機能と相関があることが、英語では知られている言語特徴量である意味密度は、日本語に適用されていません。意味密度とは、文章に含まれる命題の数を単語の数で割った値を指します。言語学において、命題とは、主語と述語、修飾関係など、単語と単語の結合の数を表します。「ナン・スタディ」の中で、修道女が20歳代で出家する時に決意を表明するために書いた作文の意味密度を評価し、80歳代になった時の認知症発症率が相関することを明らかにしたのが、米国・カンザス大学教授のスーザン・ケンパー先生です。ワークショップの目的は、認知機能と相関があることが英語で知られている言語特徴量について、文法の異なる日本語でどのように評価すればよいかを、議論を通じて新たに考えることです。ホワイトボードを用いて、例文の言語特徴量を具体的に検討しました。
ワークショップには、前日に開催したクリスマスセミナー参加者、講演者の一部に加え、九州大学、京都大学から、日帰りでの参加がありました。言語学、自然言語処理、ことば工学、回想法、アルツハイマー病、会話支援ロボットなど、異なる切り口から、言語と認知機能に興味がある研究者、学生11名が議論しました。
会場の様子
ワークショップでは、午前中、ケンパー先生に「Analyzing language and assessing complexity(言葉を分析し複雑さを評価する)」と題して、意味密度を始めとする、認知機能と相関のある言語特徴量を幅広く解説して頂きました。
昼食をはさんで午後は、まず、報告者であり本ワークショップを企画した、千葉大学准教授の大武美保子が「Survey on Idea Density(意味密度に関する調査)」について報告しました。意味密度解析に関する論文や、英語の文章の意味密度を自動解析するソフトウエアCPIDR、意味密度解析のマニュアルを紹介しました。
英語例文とその意味密度解析を基に議論
次に、千葉大学大武研究室修士一年の永松剛太が、「Idea Density(意味密度)」と題したスライドで、意味密度解析のマニュアルの英語例文とその意味密度解析を一つずつ示し、日本語の同内容の文章を意味密度解析する方法について議論しました。
意味密度の計算において、主語と述語、修飾関係など、単語と単語の結合の数を表す命題の数は、ほぼ一意に数えることができます。一方、単語の数は、どこを一単語と数えるか、区切り方によって大きく変わります。その部分がなくなった時に意味が分かる単位で区切るとよい、日本語の文法構造に合せた規則を策定するとよい、という提案を頂きました。当初は、日本語の文章を英訳した上で、意味密度を計測することを考えていました。しかし、翻訳の仕方により意味密度が変わってしまい、意味密度を保存したまま翻訳をすることが困難であることが分かりました。異なる言語同士の意味密度を比較することはできないが、同一言語の中で、意味密度の個人差や、認知機能との相関、同一人物の時間的変化は、可能であるとの結論に達しました。
2013年12月15日(日)10時より18時まで、千葉大学西千葉キャンパス自然科学系総合研究棟1 小会議室において、クリスマスワークショップを開催しました。主催は、科学技術振興機構「大規模会話データに基づく個別適合型認知活動支援」プロジェクト、共催は、「ことば工学研究会」、協賛は、NPO法人ほのぼの研究所です。
ホワイトボードを用いて言語特徴量を検討
認知機能と相関があることが、英語では知られている言語特徴量である意味密度は、日本語に適用されていません。意味密度とは、文章に含まれる命題の数を単語の数で割った値を指します。言語学において、命題とは、主語と述語、修飾関係など、単語と単語の結合の数を表します。「ナン・スタディ」の中で、修道女が20歳代で出家する時に決意を表明するために書いた作文の意味密度を評価し、80歳代になった時の認知症発症率が相関することを明らかにしたのが、米国・カンザス大学教授のスーザン・ケンパー先生です。ワークショップの目的は、認知機能と相関があることが英語で知られている言語特徴量について、文法の異なる日本語でどのように評価すればよいかを、議論を通じて新たに考えることです。ホワイトボードを用いて、例文の言語特徴量を具体的に検討しました。
ワークショップには、前日に開催したクリスマスセミナー参加者、講演者の一部に加え、九州大学、京都大学から、日帰りでの参加がありました。言語学、自然言語処理、ことば工学、回想法、アルツハイマー病、会話支援ロボットなど、異なる切り口から、言語と認知機能に興味がある研究者、学生11名が議論しました。
会場の様子
ワークショップでは、午前中、ケンパー先生に「Analyzing language and assessing complexity(言葉を分析し複雑さを評価する)」と題して、意味密度を始めとする、認知機能と相関のある言語特徴量を幅広く解説して頂きました。
昼食をはさんで午後は、まず、報告者であり本ワークショップを企画した、千葉大学准教授の大武美保子が「Survey on Idea Density(意味密度に関する調査)」について報告しました。意味密度解析に関する論文や、英語の文章の意味密度を自動解析するソフトウエアCPIDR、意味密度解析のマニュアルを紹介しました。
英語例文とその意味密度解析を基に議論
次に、千葉大学大武研究室修士一年の永松剛太が、「Idea Density(意味密度)」と題したスライドで、意味密度解析のマニュアルの英語例文とその意味密度解析を一つずつ示し、日本語の同内容の文章を意味密度解析する方法について議論しました。
意味密度の計算において、主語と述語、修飾関係など、単語と単語の結合の数を表す命題の数は、ほぼ一意に数えることができます。一方、単語の数は、どこを一単語と数えるか、区切り方によって大きく変わります。その部分がなくなった時に意味が分かる単位で区切るとよい、日本語の文法構造に合せた規則を策定するとよい、という提案を頂きました。当初は、日本語の文章を英訳した上で、意味密度を計測することを考えていました。しかし、翻訳の仕方により意味密度が変わってしまい、意味密度を保存したまま翻訳をすることが困難であることが分かりました。異なる言語同士の意味密度を比較することはできないが、同一言語の中で、意味密度の個人差や、認知機能との相関、同一人物の時間的変化は、可能であるとの結論に達しました。
千葉大学・NPO法人ほのぼの研究所
大武美保子