学力の評価と測定

学力の評価と測定
宮城教育大学
平真木夫
(たいら まきお)
[email protected]
http://staff.miyakyo-u.ac.jp/~m-taira/
話の流れ
1. 絶対評価の全面的な導入によって生じた
混乱(相対評価の撤廃によって生じた空
白)
1. 評価のインフレ現象と対応策
2. 学力低下論争で見逃されている問題
1. 瞬間最大学力という問題
3. 理想的な知識状態と,評価方法
用語説明(1)
絶対評価の分類
• 極端な態度主義・主観的判断としての絶
対評価 ・・・(別名)認定評価
• 絶対的な基準としての自己 ・・・いわゆる
自己評価、個人内評価
• 教育目標、学習目標といった目標に対す
る到達度を利用した絶対評価 ・・・到達度
評価(形成的評価)
用語説明(2)
規準と基準の違い
• 規準 ~単元の到達目標=観点
– 単元目標 「異分母の分数の足し算ができる」
• 基準 ~「どの程度できる」ようになったら・・・とい
う具体的な記述
– いくつか異なるレベル・種類の問題の中で、何割正答
したか?
• ルーブリック(rubric 評価指標)
– 数量化しにくい「基準」の場合には、質的な「基準」を
使う
用語説明(3)
特に重要な概念
• 事前段階 ・・・ 診断的評価
– 絶対評価、相対評価
• 中間段階 ・・・ 形成的評価
– 絶対評価
• 終了段階 ・・・ 総括的評価
– 絶対評価、相対評価、個人内評価
• 指導と評価の一体化
– 評価の観点と指導の目標とは一致しているべきで、学
習の指導も、すべての子どもたちが目標に到達できる
ように行うべきである。
絶対評価への道筋(1)
相対評価に対する批判
• 目標の達成度を判断する基準が、必ずし
も用意されているわけではない
• 「全ての子どもの学力保障」という理念に
反する可能性が高い
• 「テストに合わせて教える・学ぶ」可能性が
高くなる
• 個人内の変化を把握するのには不向きで
ある
学習活動と評価方法の対応関係
勉強を道具とし
て割り切る
外発的動機づけ
学
習
活
動
量
学習開始時よりも,意
欲が低下する
内発的動機づけ
勉強すること自
体が面白い
外的報酬の打ち切り(e.g., 入試など)
クラス平均がアップしても。。。
1
更に、A組とD組と
で5の価値が違
0.8
う?
A(50)
B(52.5)
C(55)
D(57.5)
頻度
0.6
0.4
0.2
0
0
10
20
30
40
50
60
70
80
90
偏差値(平均が50で標準偏差が10になるように調整)
100
絶対評価への道筋(2)
指導と評価の一体化
優勝劣敗の
• 全ての生徒に一定レベルの到達度を保障
市場原理の導入
する
• 教育機会の選択権・決定権を消費者に与
える
• 選択に必要な情報を公開する(アカウンタ
ビリティ)
評価のインフレ?学校間格差?
でも,絶対評価への完全移行で,
基準のすり合わせ作業
1. 甘い課題が使われている
こんな問題が。。。
全国標準学力試験?
2. 学力の学校間格差
3
絶対評価
人
数
相対評価
成績またはカッティングポイント
結局,こちらのタイ
そもそも,相対評価とは?
プの相対評価は生
~ 準拠集団による分類~
き残る?
• ノルム準拠評価
– 国、県といった大規模な集団から、厳密にサンプリ
ングして作成した、標準テストを用いる
– 全体の中における相対的な位置や適性を知るのに
有効
• コホート準拠評価(校内テスト)
– 特定のクラスや学校を準拠集団とした評価基準を
採用する
– 既存の一般的な相対評価であるが、大数の法則を
満たしていないので、中途半端な相対評価といえる
問題を作っている
絶対評価と目標準拠評価
側に問題がある
のでは?
大前提
• 相対評価でも、目標(問題)は目標準拠で
あって構わない
– 難易度(相対的な位置情報)が標準化された
良問を評価に利用することは、中途半端な絶
対評価より確実に優れている
よい問題と悪い問題
• 特定の問題集、ドリル、ワークばかりやっていると、
その問題と似た問題は解けるようになる( テスト
で似た問題を出してあげる。記憶力の試験か?)
– 宮城県の模試では高得点だが、山形県の模試では低
得点
• 問題が解けるということと、理解できていることとは
別であることが多い(台形の公式を使うことはでき
ても、変換作業ができない生徒もいる)
• あまり馴染みのない別の角度から質問するような
問題を使うべき
課題の難易度と評価インフレ現象
どうやったらキチンと把握できる?
絶対評価:Cの課題
相対評価:5段階で2以下
絶対評価:Bの課題
相対評価:5段階で2・3
Poor students
probable
task difficulty
Average students
proportin correct
proportin correct
proportin correct
task difficulty
improbable
絶対評価:Aの課題
相対評価:5段階で4以上
task difficulty
Good students
学力論争の3つの争点
日本の弱点は?
• 国際比較
– ある種の国威発揚?
• 世代間比較
– 昔の人は偉かった?
• 個人内比較
– 昔は頭がよかったのに。。。
学力論争の整理(1)
小学校・中学校では、学力低下が見られない
• IEA(国際教育到達度評価学会)の調査結果
– 日本はシンガポール、韓国と並んでトップグループ
• OECD/PISAの調査結果
– 日本はかなりよい成績--明らかに上位群に位置し
ている
• 平成13年度「小中学校教育課程実施状況調査
報告」
– ほとんどすべての教科で「設定通過率」を十分に越え
ている
学力論争の整理(2)
しかし、大人は・・・
• 平成13年に実施した、「科学技術に関する
意識調査」では、大人(18歳以上)の科学
的知識・興味がOECD諸国と比べて、ほ
ぼ最下位にあることが示された
小学校,中学校までトップクラスだったのが,
いきなり落ちるのは変じゃないか?
学力論争の整理(3)
他にも、、、
• 平成14年度「高等学校教育課程実施状況調査」
の結果
– 数学・理科を中心に明らかな低下がみられる
• 河合塾が入塾生に対して毎年実施している学力
調査の結果でも、同様の結果が1999年の段階で
示されている(1994年度との比較)
• 阪大の調査グループも、小学校5年生の学力が、
1989年と比べて2001年では落ちていることを示し
ている
学力論争の整理(3)
更に、ちょっと気になる結果
• 某専攻のとある学年14名に,センター試験
の国語と数学の問題を解答し,評定しても
らった
• 「受験時と比べて、どれだけ学力が変化し
ましたか?」
• +5(かなり伸びた・楽勝で解ける)~-5
(かなり落ちた・全然手が出ない)
変化度の平均
0
-1
-2
-3
-4
-5
評論
小説
古文
漢文
問題タイプ
図1.2001年度センター試験(国語Ⅰ・Ⅱ)
変化度の平均
0
-1
-2
-3
-4
-5
二次関 確率 数と式 三角比 数列1 数列2
問題タイプ
図2.2001年度センター試験(数ⅠA)
つまり、
• (受験を意識して)積極的に勉強した内容ほど忘
れやすく、学力低下も著しい
• 受験勉強の対策をたてるのが難しい科目ほど、
学力低下が少ない
– しかし、、、現国の勉強方法ってそもそもどうやるの
か?
• センター試験の識別力では不十分?
どうすれば,個人内の学力低下を予測できるのか?
果たして,予防は可能なのだろうか?
理想的な知識状態と評価
~状態が良いとは?~
•
•
•
•
成績がよい
学習意欲が高い
教科への興味・関心が高い
勉強時間が長い
受験勉強で学ばれる知識のように,特定の目的に特
化した方法で勉強すると,短期間で忘れ去られてし
まう。。。勉強方法の良い生徒
学習対象の分類
~勉強をどのようにとらえているか?~
有意味課題
無意味課題
• 有意味さをはっきりさ • 繰り返しを基本とした
学習
せておくと,学習が容
易になる(学習対象の • 学習材料の量が少な
量は増える)
ければ少ないほど,
学習が容易
• 学習対象の量が増え
ても,記憶に残りやす • 試験後に忘れても構
いし学習しやすい
わない
主な学習方略
• 反復方略
台形の公式を暗記する。ドリルで定着を図る
– 定義や手続きを記憶に定着させる
• 有意味化 問題解決の手続きではなくて,導出過程を理解する
– 既存の知識構造に関連させる
• 体制化 台形の公式で正方形の面積を求められることに気づく
– 知識構造を再構成・再構築する
台形の公式の有意味化
(上底+下底)×高さ÷2
a
a
h
h
a
h
a
b
h
a
a
a
h
h
b
a
h
b
h
b
構造化された知識の例
四角形
台形
ひし形
正方形
平行四辺形
長方形
つまり、有意味学習では、
• 学習すべきターゲット以外のことも、関連さ
せて覚えなければならない
• 記憶すべき量は、有意味化する分だけ、単
なる丸暗記よりも増える
• しかし、きちんと有意味化できた場合には、
記憶への負荷は丸暗記よりも軽いし、記
憶も持続する
台形の単元でこの問題が出せるの
か?
四角形
非典型例を
出すことの
重要性
台形
よい先生は、
単純には繰
り返さない
ひし形
平行四辺形
正方形
長方形
しかし、勉強はコストがかかって
大変…
• 学習対象を有意味化して覚えるのが良さ
そうなのは、誰だってわかる
•学習対象を有意味化するためには、ある程度
の領域知識が必要である
•すべての学習者が内発的に高く動機づけられ
ているわけではない
標準偏差(SD)の
有意味化
n
SD 
 (x
_
i
 x)
i 1
n
1. データの特徴を把握するためには代表値(平
均値、中央値、最頻値など)だけでは不十分
2. データの散らばり具合を把握する必要がある
3. 散布度として偏差の平均が使えそうだ
4. 偏差を単純に合計するとゼロになる
5. 絶対値で計算すると式の展開が面倒
6. 二乗のままだと元の測定値と単位が違うから
平方根をとらなければ不便だ
2
台形と標準偏差の比較と対処
• 記号の難しさ
– 最低限度、ある程度の繰り返しが必要
• 導出の難しさ
– 有意味化、意味の理解(+背景知識の多さ)
• 適用方法の不透明さ
– 勉強する意義・目的の不透明さ、他概念との
つながりの見えにくさ
授業の仕方で生徒の学習方略が
どれくらい変わるのか?
教科の違いと学習方略
学習方略の利用度
3.6
理科
算数
3.3
3.0
2.7
2.4
反復
有意味化 体制化
A小学校
反復
有意味化 体制化
B小学校
有意味学習を放棄したときの、
極端な対応
• 学びからの逃走…
メタ認知的判断
– レースに初めから参加しなければ、自分
の実力のなさが露呈せずに済む
• 学習性無力感
体制化
有意味化
反復
– 学習できないことを、誤って学習してしま
う
– 苦手なものがよりいっそう苦手になる
教科(単元)
(もっと?)恐ろしいこと。。。
ごまかし勉強
• 勉強=暗記,労働,反復という学習観の
獲得
• 親から子どもへ,学習観が継承される
『教育評価と教育現場における効果測
最後に。。。宣伝
定』金曜日、6:00pm~8:00pm
• 各教育評価の方法の特性を把握し,適切な効果測定の方法を
習得することを目標とする
•前半部分(11月~1月)では,始めに学習の動機づけと教育評価に関する
講義を行なう
•後半部分(2月~3月)では,統計的な処理方法を中心に評価活動に有益
な分析手法を実際に作業しながら解説する
• 演習部分では,各種質問紙の作成方法について理論的な基礎
をかため,更にソフトウェアの効果的な使い方について説明す
る(主にMS-Excelを利用)
• 参加者が学校現場で実際に取り組んでいる事例を持ち寄って,
その問題点,改善方法について討議する