Home > [J] SSLA
Sunday, September 4, 2005

Beck (1998)

Beck, M-L. (1998). L2 acquisition and obligatory head movement: English-speaking learners of German and the local impairment hypothesis. Studies in Second Language Acquisition, 20, 311-348.

(備忘録的メモ

被験者数が違うグループ間で p 値を比較しても意味がない (p. 332)

Lack of significant differences does not equal optionality. (p. 333).

Monday, November 15, 2004

Ellis & Schmidt (1997)

Ellis, N. C., & Schmidt, R. (1997). Morphology and longer distance dependencies: Laboratory research illuminating the A in SLA. Studies in Second Language Acquisition, 19, 145-171.

SSLA の「実験室での SLA 研究」特集号(編集はこの分野の第一人者でもあるアムステルダムの Hulstijn とピッツバーグの DeKeyser)掲載。僕もコンピュータを利用した実験(PsyScope とか SuperLab とか)を時々やるので興味のある分野ですが、今回は手法よりも研究対象の方に関心あり。

この論文では、人工言語(といっても実在しない言語の語彙数十個と、それに伴う複数形、格等を表す形態素ぐらいですが)を作成し、2つの調査対象として名詞の規則、不規則複数形の習得と、音韻的なチャンキング(ある程度まとまったフレーズをチャンクとして短期的に記憶すること)が統語規則の習得に及ぼす効果を調査しています。今回僕が触れるのは、個人的に興味のある前者。前回、前々回と読んできた論文とも関係しますが、一番のポイントは規則形と不規則形の形態素習得が、Pinker らの主張するように2つの別個のメカニズムによって進むのか、それとも Murphy らが主張するように、両方ともコネクショニズム的な連合学習(associative learning)の結果であるかに焦点が当てられています。

Ellis & Schmidt の研究は、人工的に作り出した名詞20個(意味を加えるためにそれぞれに絵が添えられています)を規則名詞(複数形形態素は bu- という接頭辞)と不規則形(複数形はそれぞれ異なったランダムな接頭辞)に二分し、さらに規則形と不規則形のうちそれぞれ半数の登場頻度を残り半数の5倍にし、その習得過程を調査しています。例をいくつか挙げると、規則形名詞のうち car をあらわすものは単数形が garth で、複数形が bugarth、bed をあらわす pid の複数形は bupid という具合。不規則名詞では、phone をあらわす feem の複数形は gofeem で、umbrella をあらわす brol の複数形は gubrol と、こちらは複数形も1つ1つ別個に覚えなければなりません。

コンピュータプログラム(PsyScope)を利用した学習セッションで、セッションの回数を追っての正確さ(単数形を見て複数形を正しく言えたかどうか)を分析すると、規則形の方が不規則形よりもより正確であった(つまり習得が早かった)点に加え、頻度の比較では不規則形だけでなく規則形にもその効果がみられました。つまり、より多く登場した単語については、規則形であっても不規則形であっても頻度の少なかった単語よりも高い正確度で複数形を言うことができたということになります。Ellis & Schmidt は、二重機構モデルでは規則形形態素の処理に関しては頻度の影響は出ないとしているので、これはその反証になり、さらにこの結果はコネクショニズム的学習モデル(associative learning model)を支持すると主張しています。実際コネクショニズムのコンピュータシミュレーションの結果も提示し、似たような結果が出ているとしています。

Beck (1997) でもそうであったように、実際の言語習得で頻度を統制することはとても難しいです。その結果この論文のように人工言語や人工語彙(nonce words)を利用した研究が行われるわけですが(僕のハワイ大の修士論文も、英語の nonce words の習得を調査しました)、さてコンピュータの画面上で絵と単語だけを見て、それの複数形を覚えることと、実際に自然言語で複数形を習得することとのギャップがどれほど大きいと見るか、判断が分かれるところでしょう。僕的には、この論文で取り上げられたような実験は言語の習得というよりはパズルを解くようなもので、そうすると被験者も言語を習得するというよりはパズルを解くように学習を進めるはずで、その結果、言語習得というよりは一般の学習プロセス(九九を覚えるとか、世界史の年号を覚えるとか)に近いことを行っているのではないかと感じます。その結果 associative learning といえる結果が出たとしても何の不思議もないわけで、Ellis & Schmidt も言っている ecological validity (そもそも今回の研究対象はは「言語」習得といえるかどうか)の問題が前面に出てしまうように思います。

それは別としても、インプットの中から規則性を発見し、それを獲得するのにもある程度の時間が必要なのではないでしょうか。つまり、Ellis & Schmidt の研究は、まだ規則性の認識がはっきりするよりも前の段階で終わっているのではないかということです。かなり短い時間に何回、何十回と目にしただけですから、規則形の語彙の方もまだその処理には「語幹+屈折辞」というプロセスを使えずに、複数形を別個の語彙項目として記憶から引き出している可能性があります。つまりこの段階ではまだ規則形も不規則形も同じような処理をしていると考えることもできるでしょう。もう少し時間が経った段階ではじめて規則形形態素 bu- が抽象的規則として習得され、そうなって初めて規則形と不規則形の処理に頻度による影響の差が出てくると考えてもいいのではないでしょうか。習得の初期段階に焦点を当てるというこの研究の目的が、逆に研究結果をゆがめてしまった恐れがあるように思えます。

Friday, November 12, 2004

Murphy (2004)

Murphy, V. A. (2004). Dissociable systems in second language inflectional morphology. Studies in Second Language Acquisition, 26, 433-459.

前回紹介した Pinker (1991) に関連した研究で、もっと厳密にいえば Prasada & Pinker (1993) の実験の一部を非母語話者(以後 NNSs)にまで対象を広げた研究。Murphy は心理学畑出身の SLA 研究者で(イギリスに住んでるけどアメリカ人だと思います)、語彙や形態素の習得はコネクショニズム的なモデルで説明できるという主張をしてます。Language Learning に載った 2000 年の論文で、僕もやってる compounding の研究を発表して有名になったかな(僕がそれしか知らないだけかもしれません)。

形態素の習得では、不規則形はそれぞれ個別の項目として獲得され、規則形については、(理解、表出)処理の度にその都度屈折形態素をオンラインで語幹にくっつけるというのが Pinker の主張する二重機構モデル(dual-mechanism model: 日本語訳は勝手に付けました)の基本的な部分。ここから派生して、個別に獲得される不規則形形態素は、処理で記憶から引き出す(retrieval)際にその語の頻度(frequency)や、似た語との類似性(similarity)の影響を受けるとするのが Prasada & Pinker (1993) の主張。頻度の場合、高頻度な動詞 go の過去形 went を記憶から引き出すのと、低頻度な abide の過去形 abode を引き出すのを比べたら、後者の方が手間がかかるでしょう。それに対して規則形の場合、語幹に -(e)d を付ける処理にかわりはないのだから、高頻度の動詞だろうが低頻度だろうが処理にかかる手間は変わらないでしょうというのが二重機構モデルの予測。類似性の方は、実験で実在しない語彙(nonce words)を使うからみで出てきますが、基本的な予測の方向性としては頻度と同じ。

Murphy (2004) の実験は、この類似性に関する予測が、大人の母語話者(NSs)、子どもの NSs、それに大人の NNSs の 3 グループで当てはまるかを調査したもの。簡単にいうと、実在する動詞と類似性の異なる 3 タイプの nonce verbs(わかりやすくいえば、とっても似てる、ちょっと似てる、あんまり似てないの 3 つ)を用意して、それを見せられた時に被験者がどんな過去形を作るかを調べてます。二重機構モデルは、不規則動詞に似せて作った nonce verbs の場合、実在する語と似ていれば似ているほど、それに引きずられて不規則的な屈折(活用)をさせ、実在する語と似てない場合には、規則形の -(e)d を付けると予測します。規則動詞に似せた nonce verbs の場合には、-(e)d を付ける作業はその場でオンラインで行われるため、実在する語に似ていようが似ていまいが基本的にはみんな規則活用させると予測できます。

で、Murphy の実験結果ですが、重要なところをまとめると、(a) 不規則動詞に関しては二重機構モデルの予測通りだけど、(b) 規則動詞では予測と違って、実在する規則動詞に似てる場合の方が -(e)d をよくつけるという結果です。これを元に(これだけじゃないけど)Murphy は二重機構モデルは問題だと主張しています。さらに Murphy は、コネクショニズム的なメカニズム(規則形も不規則形もすべて個々の項目とその関連のみからなる associative system) 1 つで全部説明がつくのではないかと(ちょっと控えめに)言っています。

気になる点はいろいろありますが、ここでは 2, 3 メモしておきます。まずは結果の解釈について引っかかる点。Murphy は統計データとして p 値の他に effect size(効果量?)指標の ω-squared も提示してますが、上の (a) を示す effect size が .40 なのに対して、(b) の方は .03。p 値で見れば両方とも有意であるとは言えますが、effect size でこれだけ違うのにその差を無視してしまっていいのかなと。それぞれのデータが Figure 3, Figure 4 に載ってるわけですが、図を見るだけでもこの差は歴然。二重機構モデルとは矛盾するとした (b) の結果の方は、(a) の結果と比べると微々たるものに見えてしまいます。

もう 1 点は、この研究で競合させようとしている二重機構モデルとコネクショニズムが、この実験結果について異なる予測をしてない点。これは Murphy (2000) もそうでしたが、「二重機構モデルでも説明できるかもしれないけど、同じことがコネクショニズムも予測してるよ」的な主張では、後者の方がよりふさわしいというには説得力に欠けるような気がしてなりません。Parsimony (Occam’s Razor のが有名か) だけではサポートとしては弱いです。理想的には、2 つのモデルが競合する項目をまず洗って、そこを調査するのがいいですね。話はそれますが、博士論文でそういうことができたらなと思ってはや 2 年、いや 3 年...

話を戻して、規則形形態素であったとしても、高頻度のもののうちいくつかは屈折した形で記憶されてる可能性ってあるんじゃないかなと思いました。基本的には rule-based なんだけど、高頻度のものに関しては規則形なのにあたかも不規則形のものと同じように 1 つずつ記録されていて、そういうものがある結果、本来頻度(や類似性)の影響を受けないはずなのに、弱い影響が見られるという説明ではだめでしょうか。これを実証するにはどうしたらいいかな。

何はともあれ、面白い分野だなと思います。もう少し時間ができたら、頻度の方に焦点を当てた実験を考えてみたいです。それにこの研究で引用されてる論文でいくつか読んでないものもあったので、そちらにもあたってみたいです。

さて、こんなに長くなりました。もっと簡潔にまとめる方法はないだろうか...