Home > [J] Language Learning
Thursday, May 26, 2005

Goldschneider & DeKeyser (2001)

Goldschneider, J. M., & DeKeyser, R. (2001). Explaining the “natural order of L2 morpheme acqusiition” in English: A meta-analysis of multilpe determinants. Language Learning, 51, 1-50.

SLA をかじった人なら誰もが知っているいわゆる morpheme-order studies。Goldschneider & DeKeyser (2001) は、形態素習得順序を調査したこれまでの研究を集め、調査結果を統合することを目的とした meta-analysis です。ある研究分野についてこれまでにどんなことが判明しているのかを整理するのに、従来はいわゆる literature review の形で先行研究を1つずつとりあげ、著者の判断で(ある意味主観的に)整理するやり方が主流でしたが、個々の先行研究のデータを取りまとめ、数量的に先行研究の結果を統合する統計的なメタ分析(って日本語で言うのでしょうか)が徐々に増えていくかもしれません。SLA の世界では、Norris & Ortega (2000 かな?) が文法指導の効果に関する研究をまとめたものが Language Learning に掲載されましたのが初めてぐらいではないでしょうか。そちらも100ページ近い(論文としては)大著でしたが、Goldschneider & DeKeyser (2001) も50ページという長い論文です。まとめる先行研究の数が多いせいもありますが、メタ分析の手法そのものを啓蒙する目的もあるため、分析手法の紹介にかなりの紙面を割いていることも、長くなる理由の一つですね。

さて本題。この論文では、L2 の形態素習得順序を決定する要因として、次の5つを取り上げて先行研究の結果を統合しています:

- perceptual salience
- semantic complexity
- morphophonological regularity
- syntactic category
- frequency

結論を言ってしまえば、これら5つの要因を全て合算すると、形態素習得順序を説明率71%でカバーできるとしています。これを元に筆者は “no appeal to any innate blueprints or specific syntactic models is required to explain order of acquisition” (p. 36) とまで言っていますが、さすがにこれは勇み足ではないでしょうか。コネクショニズム的な習得モデルを想定したいんだと思いますが、分析結果とこの解釈はちょっとギャップがあるように思います。

上の5つの要因について、筆者はその1つ1つの影響を個別に抜き出すことはできないと述べています。要因間にも高い関連性があるということですが、確かにその通りだと思います。本論文ではこの5つの要因で形態素の習得順序をある程度予測できるということを示してはいるものの、それらが個々の形態素の習得にどのように寄与しているのか、そのメカニズムについては不明のままです。

このような研究は今後 SLA の他領域でもどんどん増えていくべきだと思うし、実際そうなるとは思いますが、SLA のメカニズムを解明するためには、やはりこのような現象を記述するタイプの研究ではなく、何らかの理論に基づいた議論をして、その上で導き出される仮説を検証するタイプの研究が必要です。今回のメタ分析の様に、回帰分析を使ったり、因子分析を行ったりするだけではどうしても肝心な(習得)プロセスに光が当たりませんし。

いずれにしても、今後もよく引用される研究だと思いますし、これを出発点にして、色々な切り口で形態素習得の研究がさらに広がっていくことが期待されます。僕がこの論文を手にしたのも、統語、形態素習得に関するだいぶ切り口の違う2つの研究でそれぞれこの論文に言及していたからですし。

Wednesday, February 16, 2005

White (2003)

White, L. (2003). Second language acquisition and Universal Grammar. Cambridge: Cambrdige University Press.

読み終えてからすでに1週間ほど経過してしまいましたが、あらためて。Lydia White は 1989 年にとても似たタイトルの本を出してますが、今回読んだのはその改訂版というわけではなく、言ってみれば続編みたいなもの。前作が出版された後、つまり1990年代から2000年代初めまでに出た研究を概観し、必要があれば批判し、それら1つ1つを SLA 研究の中に位置づけています。Universal Grammar の枠組みに乗った SLA 研究の教科書にちょうどいいと思いますが、全くの入門書というわけではないので、これから UG 系の SLA 研究を勉強しようとする方の最初の一冊というわけにはいかないと思います。高度な知識を必要とするわけではありませんが(だったら僕が読ない)、Government and Binding (GB) についてのある程度の背景知識と、Minimalist Program (MP) についてちょっと聞いたことがあればとりあえず読めるかな。Internal argument, external argument という用語とか、Split Infl Hypothesis とかが説明もなく出てくるので、このレベルの話題についていけないとちょっと辛いかもしれません。

本書は全部で8章構成。各章のタイトルをまず挙げます:

1. Universal Grammar and language acquisition
2. Principles of Universal Grammar in L2 acquisition
3. The initial state
4. Grammar beyond the initial state: parameters and functional categories
5. The transition problem, triggering and input
6. Morphological variability and the morphology/syntax interface
7. Argument structore
8. Ultimate attainment: the nature of the steady state

言語を習得する上で、人間には言語というものに対していくつかのルール(知識)を生まれながらに持っているとする主張があり、この前提を元に母語習得、そして第二言語習得の研究が幅広く行われています。この前提となる生得的な知識を普遍文法(Universal Grammar)と呼び、これに関わる第二言語習得研究を UG 系の SLA 研究と僕は呼んでいます。

母語、第二言語に関わらず、UG 系の習得研究を行う上での大前提に poverty of the stimulus という問題があります。簡単に言えば、言語、特に統語規則の習得に必要な情報が、インプット中には全て含まれていないということであり、従って人間にはインプットの情報を補う言語の「核の部分」に関する知識(=普遍文法)を生まれながらに持っているとするのが UG 系の習得研究の大前提となります。White (2003) では、まず第1章でこの poverty of the stimulus について例を挙げながら説明し、続く第2章ではこの論点を第二言語習得にまで拡大しています。

残りの章では、第二言語習得におけるいくつかの重要な論点についてそれぞれ整理しています。第3章では initial state、つまり第二言語習得の出発点はどこにあるかという話。母語の規則体系を第二言語に当てはめるところから始まるという考え(Full Transfer)や、母語習得と同様パラメターの設定がされる前の状態から始まるという考え(No Transfer)などの主な提案が、実証研究と絡めて紹介されています。

第4章ではその後の段階の話。パラメターの再設定ができるのかどうか、functional categories は第二言語習得でも機能しているのかなど、以前は UG Access という枠組みで検討された問題を再整理しています。

第5章では、UG 系の習得研究に足りないとされている transition theory について。Kevin Gregg (1996) などの批判が有名ですが、UG 系の研究はあくまで学習者(話者)の持つ知識を扱った property theory であり、習得プロセスそのものを扱った transition theory の要素を欠いているという問題について検討されています。ここで White は、インプット中のどのような要素が習得(例えばパラメターの再設定)のきっかけとなりうるかを論理的に議論していますが、残念ながらこの章に関しては実証研究の引用はほぼゼロ。Gregg の批判が全うなものであるということをはからずも認める形になってると思いました。実証的に扱うのが難しい問題を多く含んでいますが、心理言語学的な研究者と協力して、今後調査していくべき分野ということでしょう。

第6章は形態素と統語の関係について。僕が最も興味を持っている分野の1つですが、僕がここで紹介した Lardiere (1998b) のように、言語習得がかなり進んだ段階でも形態素の使用が正確でない問題についての議論です。Functional categories 自体に問題があるとする考えと、functional categories 自体は問題なく、表面的な形態素の使用に問題があるとする考えを比較し、実証研究の分析に基づいて後者に軍配が上がるとしています。

第7章は、90年代以降に研究が盛んになった argument structure の話。有名なところでは、”Mary pushed the book to John.” はOKでも、”*Mary pushed John the book.” はダメといった例がありますが、Pinker (1989) を出発点にした、統語と意味論の関係を扱った習得研究の紹介です。

第8章は ultimate attainment の話。第3章で初期段階の話をした上で、では第二言語習得の最終段階はどうなる(なりうる)のかについての議論です。Lardiere (1998b) の被験者 Patty の例などを元に、いわゆる fossilization, stabilization などについて UG の枠組みで検討しています。

こういう本だったら、この後に全体をまとめる章があってもいいと思うのですが、第8章の最後にさらっとした conclusion があるだけなのはちょっと残念。読み終えた後でもう一度全体像に立ち返って、理解や意見を整理したいところですが、その手がかりがあったらさらにいいんじゃないかと思いました。

以下感想。この分野の第一人者のまとめた本ということもあり、主だった問題や関連研究を網羅し、1つ1つを単純に並べるだけでなく、分類、整理してある点はとてもいいです。僕なんかも、引用されている論文の多くをこれまでに読んでいましたが、もう1段上の階層で見つめなおすいい機会になりました。また、先行研究については理論的問題や実験上の問題点を厳しく批判しているのも、単なる論文紹介でない高いクオリティのレビューになっています。逆に言えば、手続き上かなり問題のあるような論文まで紹介しなければならないということで、つまりまだまだ発展途上の研究分野であるとも言えます。まだまだやるべきことが多く残っているというのは、僕ら研究者にとってはよいニュースです。特にデータ収集レベルで問題のある研究が多いことから、これからの研究では理論的な部分だけでなく、データ収集法についてもきちんと検討していく必要があるでしょう。

この本は、UG 系の第二言語習得研究を、著者である Lydia White が自分の主張を交えながら分類、紹介したものです。彼女自身は、functional categories については Full Transfer Full Access を信じ、形態素レベルの問題は Missing Surface Inflection Hypothesis の立場を取っていると考えられますが、そうでない立場の研究者がこの本を読んだときどのような反応を示すのか興味があります。僕の指導教官は White にかなり近い立場だから、僕が読んでいてもある意味スムーズに読み進められましたが、例えば Eubank とか Meisel のような立場を取る人たちの反論を聞きたいところです。

最後にもう1つ。最初に書いたように、UG 系の言語習得研究は、母語にしろ第二言語にしろ、poverty of the stimulus 問題を出発点にしています。学習者の持つ統語知識を分析してみると、インプットを元にしただけでは説明できない部分があり、だからこそ生得的な知識(UG)を持っていると仮定するのが自然であるという論法なわけで、本書でも冒頭の第1章、第2章でその点についてきちんと土台を固めているわけです。ところが、第3章以降で扱われている言語項目を見ていくと、厳密に言えば poverty of the stimulus 問題の成立していないものも少なからず含まれているように思います。「UG が存在すると仮定すればこのような説明が成り立つ」という論理展開自体に筋が通っていたとしても、インプットに含まれる情報だけで同じ結果に説明がつく場合もありうるのではないかと思いました。具体的なものは忘れてしまったので申し訳ないですが、今後 UG 系の研究を読むときには、この点頭に入れておいても損はないなと感じました。

Friday, January 21, 2005

研究論文と統計処理

このエントリーは、Second Language Research に掲載された Ionin & Wexler (2002) を読んだ上で書かれたものですが、内容がより一般的かつ重要に思われるものとなったため、分離して独立したものにしました。

僕は統計の専門家ではありませんが(むしろ数学は苦手で、センター試験を受けた時の200点満点の数学の得点は、100点満点のはずの地学の得点とあんまり変わらないぐらいでした)、自分で研究をしたり、他の研究者の論文を読んだりするのに必要な知識は身につける努力をしてきました。Ionin & Wexler も含め、Second Language Research の一部掲載論文で使われる統計処理のひどさにはホトホト参ってしまいます。仮にもこの分野で最も権威のあるジャーナルの一つが、このようなずさんな手法を取った論文を―しかもかなり頻繁に―掲載することに対して苦言を呈さずにはいられません。

例えば Ionin & Wexler の論文では文法性判断タスクの結果を載せていますが、被験者内計画の二要因(もしくは一要因)の分散分析を用いればいいところに、t 検定を続けざまに 8 つ使い、Type I Error のことなどどこ吹く風でさらには “p = .06″ の横に “Almost significant” なんて書いてます。100 歩譲ってこれに目をつぶったとしても、有意差があったなかったに関わらず、著者が注目したい差のみ勝手に強調して拾い上げているのは見過ごせません(t検定の結果有意でない差まで、本文では「差がある」と言い切ってます)。あの MIT 所属の、しかも名の通った研究者の論文がこれですから悲しくなります。

SLR ほどのステータスを持つジャーナルでも、査読者は基本的に言語学・言語習得の専門家であって、一般的に統計やリサーチメソッドに関して詳しくない人が多いでしょう。それは仕方がないとしても(だって研究の中身の方が大事ですから、そっちについてちゃんとチェックできる査読者が必要です)、通常の査読者の他に、掲載決定論文だけでもいいから数字のチェックをすることはできないのでしょうか。統計専門の査読者をつけてるジャーナルってあるのでしょうか。

もっと大胆な提案をするとすれば、統計がよくわからない人は使わなければいいじゃないですか(というのはハワイ大学の某先生が言ってたセリフです)。よく意味のわからない、しかも誤って算出されたp値に振り回され、実際の数字(生データ)を直感的に理解しようとすらしない研究者も少なくないのでしょうか。そのぐらいなら、パーセントでも何でも理解できる数字(なり図表なり)で表して、データそのものをじっくり観察すべきです。パラメトリック検定をかけるタイプのデータなら、平均と標準偏差を求めて、分布図を描いてみるのが一番良いのではとも思います(t検定や分散分析がわかる人は、t値やF値を見ながらそういうことをしてるはずです)。そもそもp値というのは、サンプル数によってどうにでもなってしまう(というと言い過ぎか)わけですから、有意だ有意でないということだけ騒ぎ立てるのは本筋から逸れてる気がしてなりません。まぁ今回の論文はそれ以前のお話だったので、こうしてあえてコメントすることにしたわけですが。

最後になりますが、SLR 掲載論文にも、統計処理のしっかりした論文もあるんですよ。僕が問題にしてるのは、誤った手法や結論の導き出し方をしている論文に対するきちんとしたチェック機構がないことです。研究の中身はとても大事ですが、手続き論についてもおろそかにしてほしくないということです。

Tuesday, January 18, 2005

Murphy (1997)

Murphy, V. (1997). The effect of modality on a grammaticality judgement task. Second Language Research, 13, 34-65.

以前ここで書いた White (1998) のレビューで少し触れましたが、学習者の言語(特に統語および形態素)知識を調査する時、テスト文を音声で提示するか文字で提示するかによって結果が大きく変わることがあります。普通代名詞(him, her など)の先行詞の解釈を調査した研究では、テスト文を印刷して提示した White (1998) では被験者は概ね正確な判断をしていた一方、テスト文を音声で提示した Finer & Browselow (1986) では、多くの被験者が誤った解釈をしたと報告されています。もしこの結果がテスト文提示のモード(written or spoken)の違いがもたらしたものだとしたら、なぜそうなるのでしょうか。僕の博士論文の研究でまずこの点について解明する必要があるため、関係のありそうな Murphy (1997) を読んでみました。

リーディングとリスニングという風に考えた時、直感的にリーディングの方が難易度が低いと思う人が多いでしょうが、なぜリスニングの方が難しいのでしょうか。Murphy が取り上げているのは control と segmentation の2点です。まず、音声を聞く場合にはスピードや聞く回数等を聞き手が制御(control)できません。リーディングの場合、自分のペースで読めばいいし、普通はちょっと戻ったり、読み返したりも自由にできます。また、音声言語の認識するには、音波として聞こえてくる音をまず意味のあるまとまりごとに区切る(segment)しなければならず、その分書き言葉を読んで理解するよりも難しいとしています。

この2つの assumptions をもとに、Murphy は母語話者と非母語話者に対して文法性判断タスクを課します。対象言語項目は Subjacency。言語学的に特に新しい仮説を調査してるわけではないので、こちらの説明は省きます。コンピュータ上で行われた実験で、被験者は文法的に正しい文と正しくない文をランダムに見て(聞いて)いきます。個々の文について、その正確性を判断していくわけですが、被験者の解答と共に反応時間(reaction time: RT)も測定されました。実験結果を簡単にまとめると次の通り:

1. 正答率、反応時間共に、リスニングタスクよりもリーディングタスクの方が成績が良かった。
2. 文法的に正しい文の判断よりも、正しくない文を判断する方が難しかった(正答率が低く、反応時間が長い)。
3. (1) は文法的に正しい文の判断では見られず、正しくない文の判断でのみ観察された。
4. 母語話者と非母語話者の違いは、文法的に正しくない文の判断に観察された。

概ね予想通りの結果ですが、ちょっとまとめてみましょう。文法性判断タスクで正解するためには、被験者はまず対象となった言語項目の規則に関する知識を持っていないといけません。規則について知らなければ、規則に反した文を間違いだと指摘できないので、当然正答率が下がります。ではなんでリスニングタスクの方が成績が悪かったのでしょうか。Murphy の説明が正しければ、リスニングタスクでは、文を理解する前に一手間二手間余分にかかるため、そちらの処理に mental resources (working memory?) が奪われて文法性判断にまわす分が足りなくなり、結果的に正確な判断ができなくなるということになりましょうか。つまり、たとえ正しい知識を持っていたとしても、言語処理に負担がかかることで誤った判断をしてしまう可能性が増すということですね。ここで問題になるのが、文法規則に関する学習者の知識と、それに関わる言語処理との関係です。Murphy は2つは別物であるといった解釈をしているようですが、そうでないとする研究者もいますから、その辺についてもう少し突っ込んだ議論が必要かもしれません。話が逸れるので、この話についてはまた別の機会に。

Murphy のこの研究では文法性判断タスクを用いていますが、picture description task や truth-value judgment task のように、より意味への焦点に重心の置かれたタスクの場合にも同じような結果になるのでしょうか。そういった研究があればあたってみる必要があるし、ないようならば自分で調査する必要がありますね。いずれにしても、このあたりの問題については、博士論文の本調査をする前に予備実験の形でいろいろ調べてみる必要がありそうです。

Tuesday, December 14, 2004

Marinis (2003)

Marinis, T. (2003). Psycholinguistic techniques in second language acquisition research. Second Language Research, 19, 144-161.

平日ということもあって、今回紹介するのはあまり heavy でない論文。

母語習得と第二言語習得との違いは、第二言語習得では多くの場合母語習得と同様のレベルに達することはありません。この原因として考えられるのは、目標言語に関する知識を獲得することができないことと、知識そのものではなく、目標言語の言語処理(processing, parsing)になんらかの困難が生じることの2つであると、著者の Marinis は言っています。さらに、UG 研究を中心とした従来の SLA 研究では、前者(言語知識、competence)の獲得(もしくは欠如)に焦点を当ててきましたが、後者に関する研究も今後増える(べき)だろうとしています。

言語処理に関する実証的データを得るには、文法性判断タスクや表出、理解タスクといったオフラインのタスクではなく、self-paced reading (listening) や cross-modal priming といった処理時間(processing time, reaction time)の測定も含めたオンラインのタスクを研究に用いる必要があるというのが Marinis の主張。先行研究分析のセクションでは、subjacency の研究に焦点を当てて、処理時間を測定するタイプの研究が示唆に富んだ情報を提供してくれると指摘しています。

論文の後半では、オンラインタスクの例として moving window technique と cross-modal priming を紹介しています。言語処理の研究をかじったことのある人ならば両方ともなじみのある手法なので、特に真新しい情報はありません。そして論文の最後では、実際に紹介したような実験をするために必要なソフトウェア、ハードウェアの紹介です。PsyScope とその製品版 E-Prime はもちろん知ってましたが、Max Planck Institute (Nijmegen) で作成している Nesu というプログラムは初めて聞きました。

Marinis は、オンラインタスクを用いた SLA 研究は少ないといったようなことを言ってますが、「そんなことないけどなぁ」というのが正直な感想です。処理時間(というか reaction time)を使った研究ならかなり多いと思うし。実際僕が 2000 年に書いた Computer Use in SLA というレビューでも 10 個ほどの研究を紹介しています。ただこういう技術的可能性について知らない研究者も多いでしょうから、そういう意味では啓蒙的論文として掲載しようという判断があったのかもしれません。

このページで一番最初に紹介した JD Brown の論文もそうですが、SLR では時おりこういうタイプの論文を掲載する方針なのかもしれません。研究としては特に新しい示唆に富むものではありませんが、こういうものを必要とする人もいるんだろうなという感じです。

Next »