テスティングに関しての入門書、OXFORDから出ているTim McNamara 『Language Testing』を、今後数回に分けてまとめていきます。
冒頭に、このテスティングが求められる理由がまとめられていたので、まずはそれを抜粋して紹介します。
1. 一般の人々は、日常生活の中で強い影響を持っている言語テストに関して、個人での理解が必要である(TOEFLや昇級試験)
2. 教育者は、仕事の中で、学習者の成績を判断するための言語テストを作成する必要がある
3. 言語学の研究者は、研究の上で、被験者の言語の熟達度を測定することが必要である
要するに、テスト作成者も研究者も、テスティングに関して、その理解が求められている。
出来る限りわかりやすいようにまとめられたら光栄です。
今回は 1章 言語テストとは何か というテーマのまとめです。
テスティングに関する研究が広まる理由
冒頭に、このテスティングが求められる理由がまとめられていたので、まずはそれを抜粋して紹介します。
1. 一般の人々は、日常生活の中で強い影響を持っている言語テストに関して、個人での理解が必要である(TOEFLや昇級試験)
2. 教育者は、仕事の中で、学習者の成績を判断するための言語テストを作成する必要がある
3. 言語学の研究者は、研究の上で、被験者の言語の熟達度を測定することが必要である
要するに、テスト作成者も研究者も、テスティングに関して、その理解が求められている。
出来る限りわかりやすいようにまとめられたら光栄です。
今回は 1章 言語テストとは何か というテーマのまとめです。
1.Testing, testing... What is a language testing?
現代社会の中で、テストは至る所、様々な分野で行われています。そして、テストは入学の選抜や資格の認定等において、重要な機能を果たしています。
しかしながら、一般の人々がそのテストについて、深く理解しているかといえば、そうではありません。我々、受ける側は、その「よくわからないテスト」を受けさせられ、一喜一憂しているのかもしれません。受験者側からすれば、テスティングという学問は極めて専門家の領域であり、彼らに依存しっぱなしで、不透明でかけ離れたもののように思われているでしょう。
これは、どのテストにも言えることであり、言語テストも例外ではありません。
元来、テストというのはなかなか変わらない側面を持つ一方で、言語テストは、元来の孤独で窮屈なものから、大きく変化してきました。そして、まだまだ変化していくと想定されます。
少し前までは、教室に詰め込まれ、鉛筆を持ちテストと向き合う試験が一般でしたが、時代が進むに連れて、インタビュー形式が取られたり、ポートフォーリオが用いられたり、コミュニケーションのなかで評価される側面を持つテストが現れました。
この点では、受験者はより純粋な能力を測定されるようになったのかもしれません。
現在用いられている様々な言語テストの手法は、どのように発展してきたのか、また、デザインされる上での原理とは。この本には、これらの問いに対する答えが書かれています。
テストを理解するには、テストがどのようにデザインされるかという方法(method)と何のためにデザインされるのかというテストの目的(purpose)の2点を押さえる必要があります。
テストの方法(method)
テストの方法は大きく2つに区別できます。それが paper-and-pencil language test とperformance test である。paper-and-pencil language test
紙と鉛筆によって施されるテストが大体、このテストに当たります。通常、このpaper-and-pencil language testでは、知識や能力はある程度独立したものとし、それらを個別に測定するために用いられる。
言い換えれば、紙面の上で、語彙や文法、リスニング能力とリーディング能力など、何かしらの知識・技能に焦点を置き、個別に測定しようとする。
このpaper-and-pencil language testに使われる形式(Test items)は、しばしば、文脈に適切な語句を考える形式(fixed response format)が用いられます。
その代表が、多肢選択形式(multiple choice format)です。センター試験大問2のA問題や、TOEICのReadingの初めの問題がこれにあたります。選択肢の中から、文脈に適切な選択肢を選び、空欄を補完し、文を完成させることで、知識・技能を評価する評価方法です。
例.(語彙に関する多肢選択形式)
I wonder what the newspaper says about the new play. I must read the
(a) critism
(b) opinion
(c) review
(d) critic
この場合、正解の選択肢である(c)のことを正答(key)といい、他の誤りの選択肢を錯乱肢(distractor)という。
performance tests
パフォーマンステストは、スピーキングかライティングを対象に行われることが多いです。
このパフォーマンステストは、学習者が最大限自然な産出ができるように、現実的なコンテクストの中で行われる配慮が必要です。
また、評価方法としては、採点者間での採点基準が異なることを防止するため、個人または複数名の採点者(rater)が、同意し合った採点の手順(rating procedure)にもとづき、受験者の産出された言語の中から採点項目を見つけ出し、評価を行います。例えば、英検の2次試験でのパフォーマンステストでも、採点基準は事前に、採点者内で細かく決められています。
テストの目的(purpose)
テストの目的は様々ですが、達成度テスト(achivement tests)と熟達度テスト(proficiency test)で分けることが多いようです。達成度テスト
到達度テストとは、学習者がカリキュラムの中の目標に対し、どれだけ達成できたかどうかを評価するテストです。このテストでは、学習者の言語運用が、実際の運用以上に、カリキュラムの目標に到達したかに焦点が置かれ評価されます。つまり、カリキュラムの目標が低ければ、あまり言語運用が高くなくても評価されますし、逆にカリキュラムの目標が非常に高ければ、多少英語が読み書きできても評価されない、ということが有りえます。
この達成度テストは、生徒がカリキュラムに関して、目標を達成できているかどうかの確認を行うことを目的としていますので、主に教育現場等で用いられることが多いです。この結果を元に、教師が自らのカリキュラムにフィードバックし、授業内容を修正できるという点で、指導と学習に深い関係性を持っています。
そのため、この達成度テストは、カリキュラムの中間、終わりに行われたり、ポートフォーリオ、観察等の形式がとられることが多いようです。
熟達度テスト
一方で熟達度テストは、学習者が実際の言語運用の中でどれだけ使用できるかどうかを測定する目的で行われます。達成度テストが、授業内での学習を対象とした「過去」を評価するものに対し、熟達度テストは「未来」において、その知識が使えることを確認するためのテストです。例えばTOEICでは、受験者がビジネス英語をどの程度運用出来るのかを測定するためのものであり、本来は「今までの学習を評価する」という目的では、使用されるのは適当ではありません。(もちろん、その英語学習のカリキュラムが「ビジネス英語を使えるようになる」ことを目標としているなら適当となるのかもしれませんが。)
また、学習者の運用を保証する基準を、目標基準(criterion)といいます。TOEICでのスコアを例に出しますと、TOEICの公式ホームページを確認しますと、
スコア 220 通常会話で最低限のコミュニケーションができる
スコア 730 どんな状況でも適切なコミュニケーションができる素地を備えている
とあります。その熟達度テストの中では、目標基準まで言語運用が熟達しているかどうかを確認できます。言語運用の熟達度が、テスト内で目標基準を超えたことが確認された場合は、「将来も運用できる」とし、保障されます。
テストと目標基準の関係
しかしながら、テスト内の運用は制限された中での産出であり、このテスト内の運用を習得されたものと評価してしまうことに関して反論もあります。そのため、より現実的な形でテストを行い、その能力に関して評価しようとするdirect testも存在します。例えば、受験者に書かせたエッセーをライティングの評価としたり、口頭のインタビューでの運用をスピーキング能力の評価することがそれに当たります。とはいえ、学習者の運用を確認するテストは、制約とは切っても切り離せません。つまり、どれだけ実際の運用を想定したところで、本物らしさ(authenticity)にも限界が存在します。
テスト作成者は、限られた環境の中で、測定しようとしている対象とテストでの結果がどれだけ目標基準と一致しているか、という妥当性(validity)を最大限保証することを考えなくてはいけません。一言に言っても、この妥当性を保証するのは非常に困難です。例えば、観察によって受験者の行動が変わってしまい、本来のデータは回収できない、といったパラドックスも存在します。
このような、テストの結果と保証している能力の間の妥当性を調査・研究することをtest validationといいテスティングの研究の中心となっているようです。
次回の2章では、『コミュニケーションとテストのデザイン』についてです。
決して英語の直訳でなく、わかりやすい日本語で書かれているので、スッと理解できました。
返信削除>paper-and-pencil language testでは、知識や能力はある程度独立したものとし、それらを個別に測定するために用いられる
我々が将来教師として用いる評価方法はpaper and pencil language testが多いと思います。その上で、「このテスト形式ではあくまでも知識を測っているのであって、(例えばスピーキングの)能力は測られていない」という認識をもっていることは重要でしょう。さもなくば、ペーパーテストだけを施行して生徒に力がついたと誤認してしまいますから。
最後でも述べられているように、テストで妥当性を保証することは大切ですが、信頼性も含めてより保証が困難なのはperformance testだと思います。しかしペーパーだけで生徒の能力は測れないため、特に英語教師は、後者のテスト方法を取り入れようとする姿勢が大切なのではないかと考えました。