Home > January, 2009
Friday, January 30, 2009

Trenkic (2007)

Trenkic, D. (2007). Variability in second language article production: Beyond the representational deficit vs. processing constraints debate. Second Language Research, 23, 289-327.

第二(L2)言語学習者にとって最後まで困難なのが、形態素の正確な使用です。日本人英語学習者の場合は、たとえば3単現の -s を常に正確に使うのはなかなか克服できない課題と言えます。冠詞の the/a もそんなやっかいものの形態素ですが、今日紹介する Trenkic の論文は、日本人にとってなぜ冠詞の使用が難しいのかについてなかなか興味深い仮説を見せてくれます。

タイトルからも推測できますが、この論文は、リサーチノートでもよく紹介している、Missing Surface Inflection Hypothesis (MSIH) と Impaired Representation Hypothesis (IRH または Reporentational Deficit Hypothesis: RDH) という2つの競合する主張に関する研究です。最近では MSIH の方が多少優位に議論を進めているという印象もありますが、Trenkic は”it [MSIH] is inherently post hoc.” (p. 291) と主張していて、言語処理の負荷がかかると形態素の誤用(正確には付けそこない)が起きると説明するものの、具体的にどのような状況でそういった誤用が起こるのかについて予測(predict)はできないと述べています。

MSIH のこの弱点を補おうとする研究に Goad & White (2004) の Prosodic Transfer Hypothesis (PTH) があります。ごく簡単に説明すると、学習者の母語(L1)にない音韻(プロソディ)パターンが L2 に出てくる時、うまく発音ができないために形態素が欠落するといった主張です。具体的には、トルコ語母語話者が英語を学習する場合、冠詞の使用において、「冠詞+名詞」という組み合わせは母語のプロソディ的にも問題ないものの、「冠詞+形容詞+名詞」とうい組み合わせの場合、英語でこれを発音する場合のプロソディ・パターンが母語のトルコ語に存在しないため、冠詞の欠落が(より)多く見られると Goad & White は主張しました。SD という仮名の学習者の英語発話データを分析した結果、上記の予測通りの結果が見られたというのが Goad & White の研究です。

Trenkic は Goad & White の研究に異議を唱えます。セルビア語母語話者の英語学習者を対象にしたこの研究での具体的な反論は次の2点。(その前に確認すべきことは、トルコ語もセルビア語も英語の the/a のように文法的な冠詞体系を持ちません。)まず、セルビア語のプロソディ・パターンを分析すると、英語の「冠詞+名詞」と「冠詞+形容詞+名詞」の両方とも対応するものが存在するため、セルビア語母語話者ならばトルコ語母語話者のように「冠詞+形容詞+名詞」という組み合わせの発話は問題なくできるはずと言います。もう1点は、ライティングのタスクでは、そもそも音韻は関係ないために、「冠詞+形容詞+名詞」の組み合わせも問題なく表出できるはずという内容。

Trenkic は、セルビア語母語話者12名を対象に、スピーキング(ペアで行ういわゆるインフォメーション・ギャップ的タスク)とライティング(セルビア語から英語への翻訳)の2つのタスクを実施し、表出中の冠詞の使用を分析しました。結果を簡単にまとめると、両方のタスクにおいて、「冠詞+名詞」よりも「冠詞+形容詞+名詞」のパターンの方が冠詞の欠落が多く見られました。これは、上記の2点において PTH を反証する結果であり、冠詞の欠落には音韻的な要因以外に何か原因があるはずだということになります。

プロソディが原因でないとすると、なぜトルコ語母語話者やセルビア語母語話者にとって、「冠詞+形容詞+名詞」というパターンで冠詞の欠落がより多く見られるのでしょうか。Trenkic の提案する原因は次の通りです。まず、トルコ語、セルビア語ともに文法的な冠詞体系が存在しません。言い換えれば、冠詞の関わる機能範疇(DP)が存在しないことになります。ところが、冠詞の持つ「ある限定されたものを指す」という意味を表す表現は、セルビア語にもトルコ語にも存在するようです。ただしそれは、英語の a/the のように、純粋に文法的に限定性を表すものではなく、どちらかというと形容詞のような機能を持っています(たとえば英語の this や that は、名詞の指す内容をある程度限定する働きがありますが、文法的には冠詞ではなく形容詞として機能します)。そこでトルコ語やセルビア語の母語話者は、英語を聞いたり読んだりする中で、the や a  というのは、this や that (やそれぞれの母語で似たような意味を持つ語)のように、形容詞の一種なんだと誤って分析してしまっているのではないかというわけです。この仮説が正しければ、学習者の頭の中には冠詞の体系や DP という機能範疇は存在しないままであることになり、これは、機能範疇等のすべての統語知識に欠落はないとする MSIH の主張と大きく異なります。さらに Trenkic は、the や a が形容詞として使われるため、統語的な規則ではなく意味(語用論)的な必要性に応じて使われたり使われなかったりするのだとしています。具体的な例として、テーブルの上に緑色と赤色のマグカップが置いてあるとき、そのどちらかを取ってほしいと頼む時に英語で何と言うか考えてみましょう。次の3つの文を見てください:

a. Pass me the red mug.
b. *Pass me red mug.
c. Pass me the mug.

(a) の文が言えればそれが一番正しいわけですが、これは「冠詞+形容詞+名詞」のパターンです。Trenkic の主張が正しいとすると、(2つのマグのうちどちらか一方であると対象を限定する意味の)the という(学習者の分析では)形容詞と、(色を示す)red という形容詞の2つが名詞を修飾するため、両方を付けようと思うと言語処理の負荷が高くなります。そこで、両方を付けるのが難しいとなったときに、どちらか1つの形容詞を省略するとします。それが (b) と (c) の可能性です。(b) は、英語の規則的には冠詞がないために誤りとなりますが、the も red も両方が形容詞である(つまりどちらかが欠けても文法的には問題ない)と認識されている場合には問題なしと解釈できます。意味を考えても、この文を聞けば緑ではなく赤いマグを正しく手にすることができるでしょう。一方 (c) は、英語の文法的には正しいわけですが、これを聞いた人は緑と赤のどちらのマグを指しているのか理解できません。

このように、the/a が形容詞であると分析してしまうと、「the/a +形容詞+名詞」の組み合わせのとき、意味的により重要な形容詞の方が残って、the/a が省略されるということが考えられます。これがまさに上記の実験結果とマッチするというのが Trenkic の主張です。最後に、以上をまとめた部分を引用します:

L2ers whose L1s do not grammaticalize definiteness analyse English articles as nominal modifiers [i.e. adjectives], and treat them in production as such.  This means that their article production is lexically based (articles are treated as lexical words) and pragmatically motivated (i.e. motivated by the perceived need to express the meaning they encode for the learner.  Whether they will appear in production critically depends on whether the need for expressing the iedntifiability of the referent has been registered at conceptual level, the level that is open to general cognition and so dependent on working memory constraints.  It will happen only if there are still some resources available after more relevant aspects of meaning have been attended to.  If, however, attentional resources have been exhausted by other demands of production, articles will not be produced. (pp. 315-316)

読んでいてとてもすっきりする論文でした。論理展開も明快で、説明もわかりやすく、なにより Trenkic の主張する内容(上記引用部分)に納得がいくというか、英語のL2学習者としての自分の intuition とも合致する感じです。日本語もトルコ語やセルビア語同様冠詞がありません。日本語に DP があるかどうかについては意見が分かれているようですが、a や the を冠詞ではなく形容詞として扱い、統語的ではなく意味的に処理しているというのは、十分あり得るように思えます。実は日本人英語学習者も PTH に反するパターンの冠詞の誤用を見せるという Neil Snape の研究もあり、PTH の立場はちょっと苦しいかなという印象です。あとは Trenkic の主張が今後 SLA 研究者の間でどのように扱われていくのか、興味深いです。

Trenkic の仮説は、冠詞だけでなく他の形態素使用にも当てはめることができるかもしれません。その辺についてももう少し考えてみたいと思います。

Friday, January 23, 2009

McCarthy (2008)

McCarthy, C. (2008). Morphological variability in the comprehension of agreement: An argument for representation over computation. Second Language Research, 24, 459-486.

今回は手元にあった最近の論文を紹介します。トピック的には、ここでよく扱っている形態素の誤用について、その原因を探る研究の一環です。

第二言語学習者は屈折形態素(inflectional morphology)をよく使い間違えることが知られています。もう少し正確に言うと、全く使えないというわけではなくて、正しく使えるときと正しく使えないときが混在することが多くの研究によって報告されています。このことを英語では morphological variability と呼びますが、その原因は該当する屈折に関する知識(representation)が第二言語学習者には欠けているとする立場(impaired representation hypothesis: IRH とか、McCarthy の呼び方では represenattional account)と、知識には問題がなく、誤用は言語処理の負荷が高くなって屈折処理ができなくなるために起こるとする立場(missing surface inflection hypothesis: MSIH、またはMcCarthy の呼ぶ computational account)があります。

Morphological variability について、McCarthy はこれまでの研究を次の3点に集約しています。

  1. IRH が主張するように屈折に関わるの知識が欠けているとすれば、同じく見られるはずの語順や(主格や目的格といった)格の割り当てのような統語処理に関する誤りは見られない(Lardiere の研究など)。
  2. 間違って屈折させる誤りは少なく、屈折をしそこなうタイプの誤りが中心であること(Prevost & White の研究など)
  3. 上級の学習者にも誤用が見られる。

上記2についてさらに McCarthy は、形態素の関わる文法素性(feature)には有標(marked)なものと無標(unmarked)なものがあり、たとえばスペイン語の性を表す素性では男性が無標、デフォルトであり、女性が有標であるとしています。これはつまり、屈折を「しそこなう」というのは、単に形態素を付け忘れるという意味ではなくて、marked なものを使うべき時に unmarked なものを使ってしまうという誤りも含むとしています。英語の場合だったら、3単現や複数形の -s や、過去形の -ed を正しく付けるか付けそこなうかというシンプルな話ですが、英語以外に目を向けるとなかなか複雑なことになっているようです。

さて、話を本筋に戻します。Morphological variability の原因として IRH と MSIH のどちらが正しいのかという議論について、McCarthy は、MSIH の立場では形態素使用の誤りは知識の問題ではなく言語処理の問題であると考えるため、言語処理の負荷の高い表出課題では誤りが見られても、負荷の低い文理解(聴解や読解)課題では誤りが見られないはずだと主張しています。一方、IRH が正しければ、表出・理解両方のプロセスで誤りが見られるはずです。そこで、同じ被験者に表出課題と文理解課題の両方を課すことで、MSIH と IRH のどちらが正しいかを判断しようというのがこの研究の中心となります。

被験者はスペイン語を学習する英語母語話者。調査対象はスペイン語の性(男性・女性)と数(単数・複数)の一致。具体的には、直接目的語の clitic(接語:英語でいう代名詞っぽいもの)と形容詞の性と数です。まずは性ですが、以下の例のように、接語や形容詞は名詞の性に一致します(例は McCarthy, 2008, p. 470 より)。

Tiene una manzana. Esta comiendola.
Have-3SG an-FEM apple. Is eating-CL-FEM
‘He has an apple. He’s eating it.’ 

manzana が女性名詞なので、その後の接語(CL)も女性形が使われます。

La camisa es blanca.
The-FEM shirt is white-FEM. 

camisa が女性名詞なので、白いという形容詞も男性形(blanco)ではなく女性形(blanca)が使われます。

同様に接語と形容詞は名詞の数とも一致するため、単数形と複数形のうち一致する方が使われます。

表出タスクは、以下の例(p. 471)のようにして接語または形容詞を表出させ、下線部性と数の一致が正しく行われているかを調べています。

実験者
¿Que va a hacer con la manzana?
What going-to do with the-FEM-SG apple?
‘What is he going to do with the apple?’ 

被験者
Va a comerla.
Going-to eat-CL-FEM-SG.
‘He is going to eat it.’

文理解タスクは、疑問文の中に接語を入れ、その接語が何を指すかを3つの絵から1つ(接語の性と数が一致するもの)を選ぶという形式です。実際に使われたものの英語訳だけ載せます:

Paco wants to bring some things that he just bought, but he can’t find anything. Paco says, ‘I just bought it-MASC: Where is it?’

‘it’ に該当する接語がここでは男性・単数という形をしているため、3つの絵の中から男性名詞で単数のものを選べば正解で、女性名詞で単数のものを選べば数は一致しているものの性が一致していない誤りといった感じです。

前置きがだいぶ長くなりましたが、実験結果を簡単にまとめると、次の通りです:

  • 表出タスクでは、接語・形容詞ともに数の一致より性の一致の方が誤りが多かった。
  • 数の一致も性の一致も、unmarked な方(性では男性、数では単数)よりも marked な方(女性、複数)が誤りが多かった。
  • 文理解タスクでも、表出タスクと同様の傾向であった(ただし数の方はほとんど誤りが見られなかった)。

表出タスクで marked な方で誤りが多かったというのは、言語処理の負荷が高いために数や性の一致ができずに unmarked(デフォルト)の形を使ってしまうことがあったと説明することができます。英語の3単現 -s に置き換えてみれば、-s を付けるべき(marked な)ところで付けそこねてしまう(つまり unmarked な単数形を使ってしまう)といった感じになり、これは MSIH の主張とほぼ一致する見解と言えるし、表出時の誤りを分析した他の研究の結果とも一致します。一方で、文理解タスクでも同じように誤りが見られたため、MSIH の予測とはことなるということが言えます。それでは逆に IRH が正しいかといえば、T(ense) や AGR(eement) といった機能範疇(functional categories)が第二言語学習者の知識から抜け落ちているならば見られるはずの、格付与や語順の誤りが見られないことが先行研究で明らかになっているためそうも言えません。

McCarthy の結論は、morphological variability の原因は何らかの知識の欠如にあるものの、統語処理にも関わる機能範疇の知識の問題ではなく、形態素の素性に関する知識の欠如が原因だろうという感じ。これは、僕が考えているのと似ているかも。日本人学習者の英語の3単現の誤りは、AGR という機能範疇が欠如しているのではなくて、その中の素性のうち、人称(person)ではなく数(number)の素性だけが欠如しているのではないかという可能性を追っていますが、一部の素性の知識が欠如しているという意味では近そう。

以下コメントです。まずは性について。数や人称と違って、性というのは一つ一つの名詞に付随するものであり、学習者は語彙(名詞)を覚える際に性についてもセットで覚えないといけません。そのため、性の一致という現象は、数や人称の一致よりも学習者の語彙の知識によるブレを大きく受けそうです。McCarthy は実験に使った個々の名詞がどちらの性を取るかについて被験者に調査をしていますが、Una manzana. (An-FEM apple.) と(この場合はリンゴが女性名詞であるということを)1回正しく言えたからといって、その被験者の中で「リンゴ = 女性名詞」という知識がきちんと内在化されているとは必ずしも言えないのではないでしょうか。この研究では、数の一致に比べて性の一致の方が誤りが多かったわけですが、もしかしたらそれは語彙知識の不安定さによる影響があったからかもしれないなと思ったわけです。性という素性の知識の問題なのか、個々の語彙項目に対する性の割り振りの知識の問題なのか、何らかの形で調べた方がよいかもしれません。

次に気になったのが明示的知識の関わり。文理解のタスクでは、数と性の屈折情報を持った接語に注目し、たとえば「男性で単数だ」とか「女性で複数だ」といった情報を手掛かりに性と数の一致した絵を選ぶという形を取っています。はたしてこの実験方法は、一般的な文理解(comprehension)であると言えるでしょうか。もし被験者が数や性の一致に関する明示的知識を持っていれば(授業で習うんじゃないでしょうか)、実験の中でその知識をフル稼働させてしまうでしょう。形態素の規則というのは、明示的知識としては比較的簡単なので、明示的知識を活性できるタスクでは正答率が上がるはずです。たとえば英語の3単現の場合、文法テストで “He (a) like (b) likes apples.” のうち (a) (b) のどちらかを選べと言われれば、ちょっとでも学校で習っていれば迷いなく (b) を選べると思いますが、実際に英語を書いたり話したりするときに -s を付けそこねるなんて日常茶飯事ですよね。形態素の知識に関する研究を行うときには、明示的知識の影響を考慮しないといけません。

最後は commission errors (過剰使用)の話。MSIH の主張に見られるように、形態素の誤りの多くは、付けそこない(omission errors)であることが知られています。McCarthy の研究をふまえれば、単に付けそこなうだけでなく、marked な形を使うべきところで unmarked な(デフォルトの)形を使ってしまうものも含めて omission errors と呼びましょう。その逆のパターンが commission errors です。これは形態素を付けてはいけないときに付けてしまう誤りであり、unmarked な形を使うべきところでわざわざ marked な形を使ってしまう誤りも含めましょう。MSIH を支持する先行研究も McCarthy の研究も、omission errors が誤りの中心で commission errors はほとんど見られないという主張をしますが、必ずしもそうではないのです。先行研究についてはSundquist (2005) のレビューでも書いたとおり、数は少ない(誤用率で 5% 程度)ながらも commission errors がどの研究にも見られます。本研究でも、たとえば接語の表出タスクの結果では、intermediate グループの場合女性形の一致の誤り(omission errors)が約 30% であるのに対して男性形の一致の誤り(commission errors)は約 5% あります。5% とはいえ、あえてデフォルト(unmarked)ではない形を使っているということにも少し注意を向けた方がよいのではと思いました。

一通り書いてから読み直してみて、うまいまとめ方じゃなかったなと反省。シンプルに説明するというのはなかなか難しいです。

Thursday, January 15, 2009

Sundquist (2005)

Sundquist, J. D. (2005). The mapping problem and missing surface inflection in Turkish-German interlanguage. In L. Dekydtsoptter, R. A. Sprouse, & A. Liljestrand (eds.), Proceedings of the 7th Generative Approaches to Second Languaeg Acqusition Conference (GASLA 2004), pp. 238-250. Somervilel, MA: Cascadilla Proceedings Project.

L2 学習者に多く見られる屈折形態素の誤りについて、その原因がどこにあるかを探る研究。90年代からずっと続いている Impaired Representation Hypothesis (IRH) と Missing Surface Inflection Hypothesis (MSIH) のどちらが正しいのかというのがテーマです(このへんについては、ずっと前に書いたこちらが参考になるかも)。

調査対象はトルコ語母語話者でドイツに移住した Ilhami という男性。移民を対象にした大規模な言語習得研究で有名な ESF プロジェクトのデータを再分析しています。

まずはトルコ語とドイツ語の動詞の屈折について。トルコ語は日本語と同じ SOV の語順ですが、動詞の屈折は rich です。下の例のように、文末の動詞には人称と数を表す形態素(1人称単数なのでここでは -im)が付きます。

Ben bu makale + yi yarin bitir + eceg + im
I this article + acc + tomorrow finish + fut +1sg
‘I will finish this article tomorrow’

また、主節と従属節では異なる形態素が使われるそうです(たとえば1人称複数の場合、主節では -sin、従属節では – (i)miz)。このことは、このノートでは紹介しませんが、論文後半で L1 の影響による誤りの説明に使われます。

ドイツ語も morphologically rich な言語ですが、トルコ語のように主節と従属節で形態素が異なるといったことはありません。下の例のように、主節と従属節の両方で動詞は同じ形です(ただしドイツ語には Verb Second (V2) という規則があるので、主節と従属節では動詞の位置が異なります)。

Fritz schreibt heute den Brief.
Fritz write + 3sg today the letter
‘Fritz is writing the letter today.’ 

… das Fritz heute den Brief schreibt
… that Fritz today the letter write + 3sg
‘that Fritz is writing the letter today’

以上を踏まえて、Ilhami の発話データを分析しています。メインとなるデータは、定形(finite)動詞が使われるべき場所と不定形(non-finite)動詞が使われるべき場所での実際の動詞使用の集計です。定形動詞を使うところ(いわゆる SVO や SOV の V の部分)では、不定形が650例中68例(10.5%)見られました。これに対して、不定形を使うべきところ(助動詞の後等)では264例中定形の使用(つまり屈折形態素の過剰使用)が14例見られました(5.3%)。Sundquist はこれをもって “although Ilhami continues to make errors in verbal inflection by inserting infinitival forms in finite contexts, he makes only a handful of errors in the opposite direction” (p. 242) としています。これは、先ほど紹介した Prevost & White (2000) の主張とも重なり、MSIH が有利とする立場です。

ここで引っかかるのが、何をもって “only a handful of errors” と言えるのかとういこと。Sundquist はχ2乗検定をかけて、10.5% は 5.3% と比べて優位に比率が違うという話の持っていき方をしていますが、これはやり方として正しくないと思います。MSIH の主張が正しければ、不定形を使うべきところで定形を使う(つまり動詞を屈折させる)ことは理論上はないはずなので、問題にすべきは 5.3% が実質ゼロであると言えるかどうかという点のはずです。動詞を屈折させるべきところで、10回に1回(10%)の割合で屈折し損ねることエラーである としながら、動詞を屈折させてはいけないところで20回に1回(5%)の割合で屈折させてしまうことをほとんど無視するのはどうも納得がいかないわけです。

MSIH の主張する mapping problem では、動詞を屈折させる(形態素を付ける)ときにつけ損ねてしまうことは説明できますが、逆に屈折させるべきでないときに屈折させてしまうという現象は mapping problem では説明できないわけです。Sundquist の研究のほかにも、White (2001) や Ionin & Wexler (2002) でもやはり4~5%の割合で屈折形態素の過剰使用が見られますが(この辺は僕が2年前にやったこちらの研究を参照。口頭発表時の PDF はこちら)、この5%前後の過剰使用を「ゼロと変わらない」と言い切ってしまうことに僕はどうしても抵抗を感じるわけです。

僕は今も日本人英語学習者の動詞の屈折(特に3人称単数の -s の使用)の研究していますが、上記の過剰使用に着目し、どうして屈折すべきでない時に動詞を屈折させるのか、その原因を探ろうとしています。そういうこともあって、5%前後の過剰使用をなかったことにしようとする研究には一言言いたくなってしまうわけです。

本研究、実は論文の後半でもう少し詳しいデータの分析を行っていますが、上記のポイントとは話が逸れるので割愛します。

Thursday, January 15, 2009

再開しました

2005年9月を最後に更新が止まっていたこのリサーチノートですが、2009年1月に再開することにしました。今後は基本的に週1回の更新を続けていきたいと思っています。About にも書きましたが:

  • 更新は週に1回。原則として木曜の夜に更新。
  • 過去1週間に読んだ文献(基本的には論文)のうち1本を選んで批評。
  • 単なる summary ではなく、critique を書くことを目指す。場合によっては summary をスキップしてコメントのみを書くこともあるかもしれません。

ということで頑張ってみようと思います。コメント、トラックバックは開放していますので、ご意見ご感想があれば遠慮なくお知らせください。

また、再開に伴い、パーマリンク(過去の投稿の固定 URL)の形式を変更しました。件名(論文著者名)を使った形になったので、以前より使いやすくなったと思います。検索エンジン経由で来られた方はご不便をおかけしますが、よろしくお願いします。