当前位置:首页 > 新闻中心
新闻中心

科学推理能力测试的效度研究与应用pdf

作者:万博外围平台注册链接 来源:万博官方平台app  发布时间:2022-08-16 09:06:48  浏览 3000

  摘要 摘 要 LCTSR2000 考察了科学推理能力测试卷 ( 中文版)的测量学指标。该测试卷整体信 度优良,具体到各维度,除控制变量推理、概率推理维度信度较低外,其余四个维度信度 较好。通过对题目的均值、标准差、题组的克龙巴赫系数、效应量、学生的作答模式等展 开定量分析,并在此基础上展开访谈,检验了科学推理能力测试卷的效度。结果表明,半 数题组效度良好,未观察到效度问题,以下试题组可能存在效度问题,它们分别是:由第 7、8题组成的问题组,由第9、10题组成的问题组,由第11、12 题组成的问题组,由第 13 14 17 18 23 24 、 题组成的问题组,由第 、 题组成的问题组,由第 、 题组成的问题组。 利用科学推理能力测试卷调查了曲阜市中学生科学推理能力水平,并对初中生、高中 生科学推理能力进行了比较。结果表明:高中生相对于初中生来说,整体上在科学推理能 力的表现更好,且个体间科学推理能力的差异缩小,但总体来看,被试学生不论处于哪个 学段,科学推理能力都亟待提高。具体到科学推理能力的各维度,相比于初中生,高中生 在除控制变量推理外的其余5个科学推理能力的子维度中都表现更好。 考察了科学推理能力的性别差异。结果表明:初中生表现出科学推理能力的性别差异, 女生的表现略逊色于男生。男、女高中生在科学推理能力测试中的表现没有显著差异。纵 观整个中学阶段,男生女生在科学推理能力测试中的表现没有显著差异。 FCI 1995 修订了力学概念测试卷 ( ( )中文版),对修订后测试卷的测量学指标进行 了研究,结果表明该测试卷适于测量中学生力学概念理解能力。研究了科学推理能力测试 成绩与FCI 测试成绩之间的相关性。结果表明:初中生科学推理能力测试成绩与FCI 测试 r 0.274,p

  0.01 成绩相关性较低 ( )高中阶段二者的相关达到中等程度 ( )。 关键词:高中生;初中生;科学推理能力;效度;力学概念测试 i abstract abstract in this paper, the measurement index of the scientific reasoning ability test volume ( chinese version of lctsr 2000 ) is investigated. the overall reliability of the test paper is good, specific to each dimension, except for the lower reliability of the reasoning dimension of control variables and the lower reliability of the dimension of probability reasoning, the other four dimensions have good reliability. quantitative analysis is carried out on the mean value, standard deviation,kronbach coefficient,effect quantity andresponsepattern ofthe students,etc. and on this basis, interview the students. the validity of scientific reasoning ability test is studied. the results showed that half of the groups had good validity, and no validity defects were observed.and the following test questions may have validity issues and should be further revised. they are: the group consisting of question 7 and question 8, the group consisting of question 9 and question10, the group consisting of question 11and question12, the group consisting of the question 13 and question 14, the group consisting of question 17 and question 18,andgroup consistingofquestion 23andquestion 24. the scientific reasoning ability test volume was used to investigate the level of scientific reasoning ability of middle school students in qufu city. we compare the scientific reasoning ability between junior high school students and senior high school students. compared with junior high school students, senior high school students generally perform better in scientific reasoning ability, and the differences in scientific reasoning ability between individuals are narrower. however, in general, students scientific reasoning ability needs to be improved. specific to the dimension of scientific reasoning ability, it is found that compared with junior high school students, in addition to the control variable reasoning, high school students have great expression in the sub-dimensions of the other five scientific reasoning abilities. the high school studentsdeductivereasoning dimensionhasmadegreatprogress. the gender differencesin scientificreasoning ability were examined.thejuniorhigh school students showed gender differences in their scientific reasoning ability. the results shows that theperformance ofgirlsinthe scientificreasoning ability test was slightly inferior tothat ofboys, but the difference was not significant. male and female high school students performed fairly well in the scientific reasoning ability test,there doesn’t behaves gender differences.throughout themiddle schoolperiod,therewasno significant difference intheperformance ofboys andgirls inthe scientificreasoningabilitytest. werevisedtheforce concept inventory test (chineseversion offci (1995) ) , studyingthe measurement metrics of the test volume, the results show that the test volume is suitable for ii abstract measuring theunderstanding of force concept ofmiddle school students.the correlation between the scientific reasoning ability test scores and the fci test scores was studied. the results show that the scores ofthejunior high school sciencereasoning ability test areweak relatedtothefci test scores, and the high school stage scientific reasoning ability test scores are significantly correlatedwiththefcitest scores. key words: senior high school students ; junior high school student ; scientific reasoning ; validity ;forceconcept inventory iii 目录 目 录 摘 要i abstractii 1引言 1 1.1 问题的提出 1 1.2研究综述 1 1.2.1科学推理能力现状研究 1 1.2.2 科学推理能力发展相关因素研究2 1.2.3侧重于科学推理能力子技能的研究4 1.2.4 科学推理能力测评工具5 1.2.5 小结 12 1.3研究内容和意义 12 1.3.1研究内容 12 1.3.2研究意义 13 2 方法 14 2.1测量工具 14 2.2研究样本 14 3lctsr2000 中文版的测量学指标研究16 3.1lctsr 科学推理测试卷简介16 3.2 信度 17 3.3 效度 18 3.3.1定量分析 18 3.3.2 定性分析25 4fci 1995 32 ( )中文版修订及测量学指标研究 4.1 fci 32 力学概念调查 ( )简介 4.1.1fci 研究32 4.2 修订原则与内容33 4.2.1修订原则33 4.2.2 修订内容33 4.3修订后fci 测试卷的测量学指标研究39 5lctsr2000 中文版的应用41 5.1科学推理能力现状研究41 5.1.1科学推理能力的总体情况41 5.1.2 科学推理能力各维度的情况45 5.2 科学推理能力的性别差异49 5.3 科学推理能力测试成绩与fci 测试成绩的相关性分析50 6讨论52 6.1lctsr2000测试卷的效度52 6.2 科学推理能力的性别差异52 6.3科学推理能力测试成绩与fci 相关性研究53 7 结论54 8本研究的不足56 参考文献57 1 62 附录 科学推理能力测试卷 iv 目录 附录2 修订后fci 测试卷70 附录3 英文版fci 测试卷79 在读期间发表的学术论文及研究成果90 致谢91 v 1 引言 1 引言 1.1 问题的提出 2017 [1] “ 年 《普通高中物理课程标准》 颁布,该标准中提出物理核心素养应当包括 物理 观念”、“科学思维”、“科学探究”、“科学态度与责任”四个方面。其中,“科学思维”要求学 生从物理学的角度认识客观事物的本质属性、内在规律,把握事物之间的相互关系;它是 基于事实、经验来建构物理模型的抽象和概括的过程,也是分析和综合、推理与论证在科 学领域的具体应用;是基于事实和证据、科学推理等对不同的观点和结论提出有理由的质 疑、进行批判并对其进行检验与修正,从而进一步提出有创造性见解的品质和能力。 科学思维是高中阶段对学生培养的重点,具有较强科学思维的学生能表现出更为优异 的创造性和开拓性,因此科学思维对学生的发展有着至关重要的作用。而科学思维又可以 划分为“模型建构”、“科学推理”、“科学论证”和“质疑创新”四个维度。科学思维的核心是 对一个多变量系统进行推断时表现出的科学推理能力。可以看出,研究学生的科学推理能 力,进而研究学生的科学思维,是具有重要意义的。 综上所述,我们就会提出这样一连串的问题,如何研究学生的科学推理能力?实际上, 想要研究学生科学推理能力的发展首先要先了解学生的科学推理能力水平。因此应该采用 何种工具对学生的科学推理能力做出区分就成了首先要解决的问题。通常,在对某一特定 能力的测量中,测量工具一般丰富多样,有着各种各样的研究视角。而我们在研究过程中 首先要对各个测量工具进行了解和甄别,选择适宜当下研究情境的测量工具,选定好测量 工具后,才可以实施测量。由于在测量过程中工具测量学指标的优劣关系着测量结果的科 学性,因此,对所选定工具进行测量学指标考察的工作也不容小觑。除此之外,了解现阶 段国内外对科学推理能力的研究情况,尝试对测量工具进行合理的应用也是一项很有意义 的工作。本文将从此问题入手,着重对上述问题进行解答。首先对涉及上述问题的已有研 究进行综述。 1.2研究综述 1.2.1科学推理能力现状研究 [2] 包雷等 对中美大学生物理学习能力和科学推理能力展开研究,他用中美两国学生在 力学概念理解和电磁学测试方面的表现来表征物理学习成绩,并考察中美学生在物理学习 成绩和科学推理能力方面的差异,结果表明:虽然两国学生在物理学习成绩上有比较大的 1 1 引言 差别,但是科学推理能力的分布差异并不大。 [3] jinghan 等 对中美两国大学生进行了科学推理能力的发展研究并在此基础上提出了 三个层次的水平划分。 [4] 张轶炳等 分析了中美两国大学生在科学推理能力上的差异,发现两国学生在科学推 理能力测试中成绩的平均值相似,没有显著差异。在科学推理能力六个维度的发展方面存 在不同,其中,中国学生更擅长假设演绎和比例推理,而美国学生在概率推理和相关推理 方面的发展则比中国学生更加完善。 [5] demet soyyılmaz 等 则利用科学推理量表(srs)测量欧洲各国学生的科学推理能力, 旨在为如何合理设置大学环境提供信息,以及为进一步优化学生的思维发展提出建议。 [6] 郭玉英等 则针对高师物理专业的学生展开科学推理能力的研究。研究表明,学生在 不同维度能力的发展水平中表现出差异。学生在守恒概念方面得到了较好的发展,其次是 控制变量维度,发展较为薄弱的是相关推理和概率推理维度。除此之外,还指出:学生的 科学推理能力并没有随着年级的增长而表现出显著增长的趋势。 [7] 杨燕等 则对高等师范院校的理科学生展开研究,发现被试学生的科学推理能力测试 成绩大多停留在较低的水平,在各能力维度的表现上存在发展不均衡的现象。其中,控制 变量推理能力处于最低水平,被试学生们在守恒概念维度表现最为优异。 1.2.2科学推理能力发展相关因素研究 1.2.2.1科学推理能力与问题解决能力的相关性 [8] 艾彤等 将对科学推理能力的研究与对原始物理问题的研究联系在一起。研究者们利 用科学推理能力测量量表与初中原始物理问题测试工具对九年级学生进行测量,结果显 示,学生的科学推理能力水平比较高,而对原始物理问题的解决能力则处于比较低的水平, 发展空间较大。具体到各个维度,科学推理能力的各子能力维度都与物理问题解决的相关 性处于较弱水平,可得到科学推理能力的各子能力维度都与原始物理问题解决不相关的结 论。 [9] 陈敏丽等 主要对广州市某中学高一年级学生展开研究,将对学生问题表征能力的研 究与对学生科学推理能力的研究联系起来。结果表明,学生的科学推理能力与物理问题表 征能力不存在显著的相关关系,而具体到科学推理的各子能力维度,则控制变量推理维度 和相关推理维度与中学生对物理问题表征的过程存在着一定的相关关系。 1.2.2.2科学推理能力与学习成绩的相关性 [10] 梁美怡等 主要研究了九年级学生的物理成绩与科学推理能力测试成绩的相关性,研 究结果表明,学生在控制变量推理维度的表现和在假设演绎推理维度的表现与物理成绩存 在很强的相关性。 2 1 引言 [11] mbt 李力舟等 利用力学基础测试 ( )成绩来表征学生的物理学科知识水平,并将测 量结果与对学生科学推理能力的研究联系起来,发现学生的学科知识水平显著影响科学推 理能力的发展。 [12] 孙慧娟等 将学生的科学推理能力测试成绩与学生的高考总成绩、理综成绩、数学成 绩联系在一起,从而研究科学推理能力与学习成绩之间的相关关系。结果表明在考虑范围 内的三门学科中,学生的理综成绩与科学推理能力成绩相关性最高,说明学生对物理、化 学、生物等科学课程的学习将有助于提高学生的科学推理能力。 1.2.2.3科学推理能力的区域性研究 李力舟等主要讨论了不同地区学生科学推理能力的异同。研究者主要对甘肃甘南藏族 地区的中学生与北京地区的中学生展开科学推理能力的测量。结果表明,整体来看,北京 地区学生的科学推理能力水平明显优于甘南藏族地区学生的科学推理能力水平。具体到科 学推理能力内部各个维度来说,北京地区的学生在守恒推理维度、比例推理维度、控制变 量推理维度和概率推理维度的表现明显优于甘南藏族地区的学生。而在相关推理维度和假 设演绎推理维度,两地区学生并没有表现出显著差异。 1.2.2.4科学推理能力的性别、民族差异 李力舟等研究了不同性别的学生在科学推理能力上的差异。结果显示男生和女生在科 学推理能力上存在一定的差异,且女生的科学推理能力相对于男生来说发展得更加成熟。 孙慧娟等研究了不同性别、不同民族的学生在科学推理能力测试中表现的差异。结果 表明:不同性别的学生在科学推理能力测试的表现方面并没有显著的差异,而不同民族的 学生在科学推理能力测试的表现方面存在显著差异,其中汉族学生在科学推理测试中的表 现优于回族学生。 [13] 张轶炳等 对中国的西部地区的大学生进行测量,发现不同性别的大学生在科学推理 能力测试中的表现没有显著差异。具体到科学推理能力的各个子能力维度,则男女被测对 象仅在控制变量维度上表现出显著的差异性。 [14] 冯秀梅等 关注中美大学生科学推理能力与性别之间的关系,通过研究,指出:就两 国学生在科学推理能力的作答表现来看,都存在着显著的性别差异。中国学生主要在控制 变量推理维度和假设演绎推理维度上表现出显著的性别差异,而美国学生则几乎在所有推 理维度和大部分的测试项目中都表现出了性别差异,因此相比于中国学生,美国学生的性 别差异表现的更加显著。 [15] 周思琪 研究了高一、高二年级学生在科学推理能力测试表现上的性别差异。结果表 明,不同性别的学生在科学推理能力的测试表现上存在显著差异,而且男生的科学推理能 力水平显著高于女生。 3 1 引言 1.2.2.5科学推理能力的年龄 (年级)差异 张轶炳在对中国西部地区大学生科学推理能力的研究当中指出,不同年级的学生在科 学推理能力测试中的表现存在显著差异。相比较而言,学习工科专业的学生科学推理能力 处于更高的水平。具体到科学推理能力的各子能力维度,则不同年级的被试在概率推理维 度与多层次假设推理维度的表现存在显著差异。随着年级增长,除了逻辑推理维度和原因 关联维度存在显著下降趋势外,其余各维度科学推理能力都随着年级的增长而增长。而不 同专业的学生在科学推理能力的各个维度上都存在显著差异。 周思琪研究了不同年级的学生在科学推理能力测试中的表现,结果显示:不同年级的 被试在科学推理能力测试中表现不同,存在显著差异。 [16] 魏昕等 研究了北京地区二年级到高三年级学生科学推理能力的发展,得出二年级到 初一年级,学生的科学推理能力在统计学意义上并没有表现出显著差异,即处于该阶段的 学生在科学推理能力方面没有表现出显著发展。而初一年级到高三年级的学生则呈现出了 显著上升的趋势。就各能力维度而言,研究者发现比例推理能力在三年级开始发展速度骤 增,处于一个较高的水平。同一阶段,学生在控制变量推理维度、相关推理维度和高级控 制变量推理维度、假设演绎推理维度的发展速度则比较缓慢。相比于控制变量推理维度和 相关推理维度,学生的高级控制变量推理维度和假设演绎推理维度水平则更低一些。 [17] 白明侠 对银川能源学院的中专、大专和本科生进行调查,发现处于不同学习阶段的 学生在科学推理各能力维度上的表现存在着显著差异。学生的科学推理能力随着中专、大 专和本科呈现逐渐增强的趋势,说明科学推理能力与年级 (年龄)存在显著的相关性,具 体到科学推理的各子能力维度则存在着发展不平衡的现象。在守恒推理维度,处于不同学 习阶段的学生都表现的比较优异,说明不同学习阶段的学生在守恒推理维度发展较好,而 对于其余科学推理的子能力维度则发展不良,说明大部分学生缺乏这些维度的推理能力, 并集中表现在概率推理维度和假设演绎推理维度上。 杨燕等对科学推理能力与院校层次、专业、年级的相关性进行了研究,发现科学推理 各能力维度得分在不同院校间表现出显著的差异,而在不同年级和不同专业之间的差异显 著,并进一步指出:师范院校在理科方面的教学并没有在提高学生的科学推理能力水平方 面发挥出巨大的作用。 1.2.3侧重于科学推理能力子技能的研究 [18] 国内侧重于科学推理能力某一子能力维度的研究起步较晚,周少娜等 对科学推理能 力的其中一个子技能——控制变量维度进行了深入研究。研究中,她主要对中、美两国学 生控制变量维度的科学推理能力进行测评和描述,并在此基础之上提出了控制变量推理能 力对学生科学推理能力发展的意义。 [19] 在国外,graaf、joepvan der 等 则运用动手实验任务来评估儿童的变量控制能力, 4 1 引言 并以此测试作指标,估计幼儿的科学推理能力。 [20] 与graaf、joepvan der 不同,jeanettepiekny 和dietmar grube 等 则使用访谈任务来 研究儿童的证据评估能力等,并以此访谈结果作指标,进而估计学生的科学推理能力。 通过对上述研究的梳理我们可以发现,为了研究学生的科学推理能力水平及影响科学 推理能力的相关因素,研究者们要完成的首要任务就是测评被研究者的科学推理能力水 平,即选用合适的工具对被试的科学推理能力水平展开测量。而用于测量科学推理能力的 工具五花八门,十分庞杂,所以有必要对现有科学推理能力的测评工具进行梳理,以期为 后续研究选择最适宜的测评工具做参考。 1.2.4科学推理能力测评工具 以“scientific reasoning”为主题词,检索web of science 数据库,并通过选择“web of science ” 545 核心合集 对所得文献进行精简。通过初选,共筛选出文献 余篇。通过阅读题 名、摘要和关键词,对文献进一步筛选。对于包含科学推理能力测量的文献或在研究过程 中将科学推理能力作为一个研究指标的文献进行全文精读,筛选并进一步查找使用的测量 工具。根据附录或参考文献找到对测量科学推理能力工具进行描述的原文,对文章进行精 读,整理并汇总科学推理能力的测量工具。 除了已经被广泛应用的经典测量工具,如:act(theamerican collegetesting)、galt groupassessment oflogicalthinking tolt test oflogicalthinking ( )、 ( )等,还有用于 对科学推理能力、或对科学推理能力所涵盖的某一领域进行测量的测量工具。 通过汇总整理,按照测量工具的使用方式,将这些测量工具分为纸笔测验式以及访谈 式 (包括任务类)两个类别。下面将依照测量形式的分类,依次对这些工具进行简单的介 绍。 1.2.4.1纸笔测验类科学推理能力测量工具 (1)act theamerican collegetesting ( ) act 是美国的标准化大学入学考试,强调对学生在高中课程中已掌握课程知识的测 量,用于衡量学生对大学入学的准备程度,它主要涵盖有四个部分:英语、数学、阅读和 40 科学推理。其中科学推理部分共包含 题,涵盖分析问题、解决问题、评估证据、解释 现象和推理等技能,该部分的测试时间约为35分钟。 在这部分问题的作答中,得分最高的被试不一定是那些最了解背景 (如例题中蚂蚁生 活习性)的人,而是能够更好的理解文中信息并基于这些信息对选项做出严格判断和推理 的人。正确的解题方法和应试技巧是要求被试抓住题目的关键信息为指导,在此基础上做 出判断、推理,而日常的生活信息还有可能对被试造成误导。 5 1 引言 (2)galt groupassessment oflogicalthinking ( ) 逻辑思维群体评估(groupassessment oflogicalthinking,简称galt)是由roadrangka, [21] vantipa 于1983 年开发的测量工具 。这份测试题主要测量了六个维度的逻辑思维能力, 包括物质守恒推理、比例推理、控制变量推理、组合推理、概率推理、相关推理。题目类 型为多项选择题,每个题目都包含有示意图,目的在于对测试题进行解释说明,galt 的 开发者已经对工具的测量学指标进行了研究。 galt 21 21 最初的问题集由 组题目组成,题目设计形式为双层多选设计,也就是 组 题目中的每组题目都包含两个小题,两个题目中的第一题都要求被试给出答案,第二题则 都要求被试勾选出选择第一题答案的原因。galt 的21组题目包含4组物质守恒推理题目、 6 4 3 2 2 组比例推理题目、 组控制变量推理题目、 组组合推理题目、 组概率推理题目、 组 相关推理题目。 由于galt所含题目众多,必然带来其在测试时间方面要求较高的特点,而在实际应 用时,由于时间限制或出于其他原因,可能需要一份更短的测试卷,更简洁方便地进行测 量。为此,roadrangka,vantipa还提出了缩写版的galt测试卷,通过研究发现,缩写版 的galt可以从六个测量维度的每一维度抽取两组项目来构建测试。在这里,roadrangka, vantipa 1 4 给出了一个建议组合 (包括:物质守恒推理维度的第 题和第 题;比例推理维度 的第8题和第9题;控制变量推理维度的第11题和第13题;概率推理维度的第15题和第 16题;相关推理维度的第17题和第18题以及组合推理维度的第 19题和第20题),并对 由上述题目组成的缩写版galt测试卷给出评分标准:当且仅当被试能够选择正确答案并 且推理理由也选择正确时,得 1分,否则得0 分,缩写版galt 测试卷共有 12 组题目, [22,23] 试卷总分为12 分。缩写版的galt在国外已经得到广泛应用 ,而就国内来看,也已有 galt [24] 研究者如朱思敏等应用缩写 的中文版实施测量 。 除此之外,roadrangka,vantipa还对测试分数进行了进一步说明和归类。roadrangka, vantipa将不同的测量分数对应划分为不同的推理能力水平:得分为0-4 分的被试推理能力 5-7 处于具体运算阶段,得分为 分的被试推理能力处于具体运算向形式运算过渡的阶段, 得分为8-12 分的被试在科学推理能力方面被认为是处于形式运算阶段,我国研究者朱思敏 在其研究中对被试思维水平的划分也与roadrangka,vantipa 一致。 (3)tolt test oflogicalthinking ( ) 逻辑思维测验 (test oflogicalthinking,简称tolt),是由tobin,kenneth g 和w. [25] [26] capie 于1981年开发的测量工具,初始版本的开发基础是基于lawson 1978 的十个题目 lawson adi karplus 1979 [27] tolt 以及 、 和 在 年发表的研究 。 主要测量了五个维度的逻辑 思维能力,包括:控制变量推理维度、比例推理维度、组合推理维度、概率推理维度和相 关推理维度。tolt测试总共包含十个项目,其中,前八组题目形式为双层多选设计,同 galt 的题目结构一样,每组题目包含两个小题,第一小题要求被试回答答案,第二小题 要求学生对选择答案的原因进行说明。开发者tobin,kenneth g 和w.capie 已经对该套测 6 1 引言 试卷的测量学指标进行研究。修订后的tolt测试题目中的示意图是以彩色图片的形式来 呈现的,整份试卷的测试时间为40分钟。同样的,tolt也已经在国外得到了广泛应用[28-30], [31] 就国内而言,吴剑 也已经利用tolt 的中文版进行测量并进行了相关性研究。 (4)ctfr-78 lctsr 与 ctfr-78 (classroomtest offormalreasoning)是1978年由lawson 开发的形式推理 [32] 课堂测试 ,该测试是基于皮亚杰的认知发展理论而开发的。ctfr-78涉及 15个项目, 每个项目的作答都是先由教师面向学生进行演示,然后学生在回答册上回答两个问题。要 求教师向学生进行演示造成ctfr-78在实施上存在一定困难。ctfr-78 的题目结构仍为双 层多选设计,同galt和tolt 的题目结构一样,ctfr-78 的题目也是每两道题目为一组, 第一题要求被试选出答案,第二题要求被试选择原因。ctfr-78主要测量的维度包括质量 和体积守恒推理维度、比例推理维度、控制变量推理维度、组合推理维度和概率推理维度。 其测量学指标已经过lawson 验证。 lctsr lawson’s classroom test of scientific reasoning 2000 lawson ( )是 年由 在 ctfr-78 的基础上进行修订后推行的科学推理课堂测试题。其题目包含12 个题组,共24 道题目,题目设置仍为多层多选设计。lctsr 的测量形式为纸笔测验,所有24 道题目全 部为具有多个选项的单项选择题,考虑到ctfr-78在测量中的缺点,lctsr 进行了有针 对性的改进,整份试卷不涉及演示实验。其测量的领域包含质量和体积守恒推理维度、比 例推理维度、控制变量推理维度、概率推理维度、相关推理维度和假设演绎推理维度。该 工具已在教育测量领域得到广泛应用,但是对lctsr 测量学指标的研究不够完善,因此 在使用lctsr进行科学推理能力的测量时,要对lctsr 的测量学指标进行进一步的考察。 ctfr-78与lctsr2000所包含的题目,可用表1做对比总结: 1ctfr-78 lctsr2000 表 与 题目说明 测量维度 ctfr lctsr 题目细节 改变放置在天平两端的两个相同的粘土球 质量守恒 1 1,2 的形状。 考察两个不同情况下的圆柱之间的水面高 体积守恒 2 3,4 度问题。 比例推理 3,4 5,67,8 在粗、细试管之间倒水并预测水位。 比例推理 5,6 在天平上移动重物并预测平衡位置。 控制变量 7 9,10 设计实验,测试弦长对单摆周期的影响。 设计实验来测试小球的重量对单摆周期的 控制变量 8 影响。 使用一个斜坡和三个金属球体来检查质量、 控制变量 9,10 释放位置对碰撞的影响。 7 1 引言 控制变量 11,1213,14 观察试管中的果蝇受红蓝光和重力的影响。 组合推理 11 计算控制灯的四个开关的组合。 列出代表购物中心商店的四个物体的所有 组合推理 12 可能的线 预测从袋子中取出某些彩色木块的概率。 15 通过呈现的数据预测小鼠的大小与其尾巴 相关推理 19,20 的颜色之间是否存在相关性。 假设演绎 设计实验以确定在点燃蜡烛后水冲到玻璃 21,22 推理 杯中的原因。 假设演绎 设计实验以确定添加几滴盐水后红细胞变 23,24 推理 小的原因。 ctfr-78 lctsr2000 从表格中可以看出,相比于 , 则去掉了对组合推理维度的考察, 增加了对相关推理维度、假设演绎推理维度的考察。并对控制变量维度、比例推理维度、 概率推理维度的相关题目做出调整和修改。 (5)srs scientificreasoning scale ( ) 科学推理量表 (scientificreasoning scale,简称srs),是由caitlin drummond [33] 和baruchfischhoff 于2015年开发的测量工具。起初,srs量表由20个测量项目 11 组成,经过一系列研究,最终它被确定为一份包含 个真假判断项目的测试卷。测试卷中 的每一个项目都集中于对一个概念的测量。例如对判断信度能力的考察、对控制变量能力 的考察、对判断因果关系能力的考察等。 在srs量表中,每一个项目都描述了一个假设的研究方案,要求被试判断题目中列出 的方案是否可以导出方案中所预测的推论。caitlin drummond 和 baruch fischhoff 已经针对该量表的测量学指标进行了研究。国外也已有研究者利用srs对大 [34] 一学生科学推理能力进行测量,作为研究被试学生科学思维发展的重要指标之一 。由于 该工具出现时间较短,虽在国外部分研究中得到应用,但目前在国内尚未找到使用该工具 来测量学生科学推理能力的研究。 (6) control ofvariables cov 对 ( )维度的测量工具 shaonazhou、jinghan 等开发了一种用于评估中学生cov (controlofvariables)能 力的工具。shaonazhou 认为,变量控制 (cov)是科学推理的核心子技能,是在科学探 究过程中 (如形成假设、实验设计和评估、分析数据、决策制定等)几乎所有阶段都需要 [35] 用到的重要能力。为此,他们在boudreaux 等 在2008年的研究基础之上,开发了一种用 于评估中学生控制变量能力的工具,目的在于帮助研究人员更好地对不同年龄阶段学生典 型推理模式进行判断和理解,以便更好地对学生进行指导,并为相关研究在评估学生控制 8 1 引言 变量能力等方面提供信息。shaonazhou 在其2016年的研究当中对该工具进行了详细的阐 述,该cov 维度的测量工具包含a、b 两套测试题,每套试题都包含三个虚拟情境,a、 b 两套题中的虚拟情境完全相同,它们包括一个生活情境 (围绕钓鱼问题展开)以及两个 物理情境 (围绕弹簧问题和单摆问题展开)。对情境的叙述是以表格的形式展开的,并通 过表格向学生呈现必要的数据,但在a、b 测试卷中,表格所呈现的信息有所不同:在b 测试题中,表格的内容包含对实验条件的说明和实验结果的数量性描述;在a 测试题中, 表格的内容仅对实验条件进行了说明,并没有对实验结果进行数量性描述。每套试题中三 个题目都要求学生找到导致结果发生改变的变量,也就是自变量,并写下做出判断的原因。 (7)kgs调查问卷或证据能力测试 有研究者认为:理解证据是科学推理的一个重要步骤,而理解证据的过程也就是将测 量的原始数据归结为对结论陈述的过程。heisawn jeong、nancy b.songer 等认为证据评估 [36] 能力是科学推理能力的组成部分之一 ,因此他们在研究中引入了证据评估的能力,并考 察为了收集优质、有效的数据所需要的推理技巧等。 kgs调查问卷,是由heisawn jeong、nancy b. songer 等开发的一种用于评估儿童理 解水平的课堂评估,采用纸笔测验的方式来进行测验。最初该问卷调查的设定是为了制定 kidsasglobal scientists kgs kgs 一门名为 ( )的特定课程计划,但经过研究, 试卷可独 立于kgs课程计划应用。 kgs调查问卷包含 12 个问题,主要研究了六个维度,包括判断证据的优先级的能力 1 2 6 9 维度 (问题 和问题 )、考察证据相关性的能力维度 (问题 和问题 )、考察证据可 复制性的能力维度 (问题3和问题12)、考察证据客观性的能力维度 (问题4 和问题11)、 对示例进行解释的能力维度 (问题5和问题10)和对表格进行解释的能力维度 (问题7 和 8 kgs 12 galt tolt lctsr 问题 )。在 调查问卷的 个题目中,有一半问题的设置与 、 、 相似,都要求学生先对答案作出选择,再通过简单的叙述证明他们的选择是合理的,即说 明选择答案的理由。相比于galt、tolt、lctsr 测试卷,kgs在另一半题目的设置上 选择了另一种呈现方式。它要求学生直接根据题目的情境进行推理,并以开放式的问题形 式引导学生作答,学生需要根据题目所述的情境,自己组织语言,以简答的形式对问题进 行回答。值得注意的是,kgs调查问卷在实际测试中,除了第7题和第8题有着固定顺序 不可改变外,其余问题的顺序是随机排布的,完整版的kgs调查问卷可在heisawn jeong、 nancy b.songer 等2006年的研究中查得。 (8)cvsi 问卷 control-of-variables strategy cvs 控制变量策略 ( ,简称 )结合了涉及对照实验和结实 实验结果的重要科学推理机巧,也是科学思维的重要组成部分。因此,martin schwichow, [37] simon christoph 等 开发了一种新的控制变量策略的测量工具 (cvs inventory 简称 cvsi),并对其测量学指标进行了研究。 中学物理背景下开发的cvsi 工具由23个多项选择题组成,每题都有一个正确答案和 9 1 引言 三个干扰选项,题目的考察主要集中于热学和电磁学部分。为了减小由于阅读文字带来的 障碍影响对学生cvs技能的判断,在cvsi 的题目中,每一道题目都配有相对应的插图, 试卷测试时间为25 分钟,测量的维度分为四个,包括pl (planing controlledexperiments, 5 in interpreting controlledexperiments 所有项目都要求被试选择材料规划实验)、 个 ( )项 目、11 个 id (identifying controlled experiments)项 目和 7 个 un (understanding the indeterminacy ofconfoundedexperiments)项目。缩写版本的cvsi 测量包括6个id 项目、 3 in 3 un 15 martin 个 项目和 个 项目,测试时间为 分钟。有关该测量工具的具体阐述可参考 schwichow,simon christoph 在2016年的研究。 1.2.4.2访谈式科学推理能力测量工具 利用访谈的形式来对学生科学推理能力进行测量的工具主要有: (1)天平平衡问题 [38] 在marlenny guevara a、marijn van dijk 等人 于2016 年发表的研究当中,考察了幼 儿同伴之间的互动与科学推理技能的变化过程。他们使用案例研究的方法,考察同伴之间 的交互作用和科学推理技能 (scientificreasoning skills,简称srs)的变化。 marlenny guevaraa、marijn van dijk 等在对两名幼儿srs技能的研究当中,对被试学 生进行考察所使用的访谈工具为天平平衡问题,该工具在国外的研究中已不乏有应用基 础。在这里,被试学生尝试解决7个以特定顺序呈现的天平平衡问题,根据被试的回答, 对答案进行编码,编码体系共分17 种,并据此研究被试儿童在问题解决任务中的同伴交 互作用和科学推理技能的变化。 (2)“增加玫瑰数量”问题 [39] 在kempert, sebastian 和i.hardy 于2015 年的研究当中,考察了儿童在双语背景下 kuhn pease[40] 2006 的科学推理能力。其研究所使用的访谈推理任务改编自 和 在 年最初开 发的推理任务。由kempert, sebastian 和i.hardy 改编后的推理任务仍遵循kuhn 和pease 所使用的基本程序,kuhn 和pease 为测量任务选择了泰迪熊销售的情境,而kempert, sebastian i.hardy 和 为该工具选择了生物学的背景,即被试学生要帮助弗里达弄清如何增 加玫瑰丛中生长的玫瑰数量,并对kuhn 和pease 的推理任务进行多种方式的修改。在此 对kempert, sebastian 和i.hardy 的增加玫瑰数量问题进行叙述,而kuhn 和pease 的具体 问题情境与呈现步骤可参考其2006年的研究。 kempert, sebastian 和i.hardy 应用的“增加玫瑰数量”问题基于以下三个步骤: ①用图片呈现八个想法,并依据四个不同的规则a、b、c、d,如:你认为哪个方法对 a b c d 增加玫瑰的数量最有效?选择四张可能影响玫瑰数量的方法并依次命名为 、 、 、 ,其 中a 和b 为被试认为对增加玫瑰数量有益的方法,c 和d 是被试认为不利于增加玫瑰数量 的方法。 5 a b ②构建虚拟情境,按照图片的形式,说明弗里达进行了 个实验,测试者将上述 、、 10 1 引言 c d a b c d 、 四个想法按规则进行组合,并向学生展示结果,如:同时使用 、 、 、 四个方法, 玫瑰数量增加10朵。 ③根据方法组合和结果的说明,要求被试找到弗里达能够增加玫瑰数量的最佳方法。 (3)“ ” 控制变量策略 的动手实验任务 [41] 在graaf、joepvan der 等 2015年的研究当中,使用了一个动手实验任务,通过评 估儿童的控制变量策略进而估计被试幼儿的科学推理能力。在该文章当中,使用的是由 chen,z. d.klahr[42] 1999 cvs control ofvariables strategy cvs 和 于 年开发的 ( ,简称 )中的 “斜坡任务”,采用的评分方法为实验正确评分 (即正确设计实验的总数)和可变正确评分 (所有实验正确设置的变量总数)两类。通过对以上两篇文献使用的工具部分进行比较阅 chen,z. d.klahr. 1999 cvs 读,将简要介绍包含更多评估任务的 和 于 年开发的 工具,该 工具的测量学指标已经被作者进行评估。 该测量工具共包含有三种类型的动手实验任务,分别是弹簧任务,斜坡任务和物体沉 没任务。每个实验任务中都包含四个二分变量。变量及待测问题等相关详细内容可查阅其 研究文献。 (4)评估证据与检验假设实验的访谈任务 klahr dunbar 1988 sdds 和 于 年提出的 模型,并指出:科学推理过程中的认知成分 包括制定假设、实验和评估证据。制定假设就是基于先验知识或归纳推理的过程得出假设, 而实验则指设计一个合适的用于检验假设的实验,评估证据则是需要根据数据在不同的假 设之间做出决定。 [43] 而jeanettepiekny和dietmar grube等 在2014年则根据两个访谈任务对幼儿园儿童 的实验部分和评估证据部分进行了研究。 jeanettepiekny dietmar grube koerber 对评估证据的任务来说, 和 等使用的是基于 等 [44] 人在2005 年 的研究当中使用的推理任务。主要使用两个木偶创设虚拟情境,展示健康 或不健康的牙齿与红色、绿色、蓝色口香糖之间的关系,例如一组10 张的卡片都呈现红 色口香糖与不健康牙齿的组合。通过呈现不同的证据,要求被试回答有关两个木偶对牙齿 健康和口香糖颜色之间因果关系的评估。 对实验任务来说,jeanettepiekny 和dietmar grube 等使用任务是基于sodian 等人[45] 在 1991年研究中使用的推理任务,并在其基础上对做了修改。利用两个木偶、两个开口 程度不同的盒子充当“鼠室”、一些作为视觉辅助工具的食物进行研究。主要分为两个任务 即饲料任务 (即提出确保老鼠可以获得食物的条件,要求被试儿童选择鼠室内)和找出任 务 (即要求通过鼠室确定老鼠的个头大小)。以上所涉及的所有的问题都是开放式的回答 问题。 (5)区分认知发展水平的访谈任务 reuven babai 和tamar levit-dori[46]在对case 课程的评估研究当中对中学生进行了 皮亚杰的认知水平的评估测试,并将该项评估的结果作为研究实施case 课程是否对被试 11 1 引言 学生的科学推理能力起有益作用的指标之一。 reuven babai 和tamar levit-dori 等使用的工具是 1976 年由m. shayer,d 和e. [47] kuchemann 等 开发的测量工具,其理论基础是皮亚杰所描述的访谈任务。该工具可 m.shayer d e.kuchemann 用于区分儿童的认知发展水平, , 和 等在文章中对工具的 测量学指标也进行了说明,运用该工具对被试认知水平进行划分的文献层出不穷。 由m.shayer,d 和e.kuchemann 等开发的工具主要包含有三个任务,第一个 1 任务是基于儿童的空间概念而设计的访谈任务,涵盖早期具体运算水平 (第 阶段)到具 体运算水平后期 (2b);第二个任务是基于儿童的数量建构而设计的访谈任务,包含从早期 具体运算水平 (2a)到形式运算水平 (3a);第三个任务是基于单摆任务而设计的访谈任 2b 3b 务,包含从后期具体运算水平 ( )到后期形式运算水平 ( )。 1.2.5 小结 通过上述梳理我们大致可以看出,现如今测量学生科学推理能力的工具繁杂多样,又 有着一定的内在联系,比如在运用纸笔测验方法来测量学生科学推理能力的工具中,galt 和tolt 都参考了ctfr-78 的研究,而ctfr-78 的改进版本即lctsr2000 则是目前应用 最为广泛的用来测量学生科学推理能力的测量工具。除此之外,新出现的srs科学推理能 力量表近年的应用情况也呈上升趋势。 统观推理任务式测量工具,我们可以发现他们之间也有联系,比如天平平衡问题来自 于评估证据与检验假设的实验访谈任务,而研究者所使用的“小熊销售”问题是改编自“增加 玫瑰数量”问题等。 1.3研究内容和意义 1.3.1研究内容 本次研究的研究内容主要包括: (1)对修订后的lctsr2000科学推理测试卷中文版进行测量学指标的考察; (2)修订fci (1995)中文版测试卷; 3 ()研究曲阜市高中生、初中生科学推理能力; (4)探讨影响中学生科学推理能力的因素,考察学生的科学推理能力与力学概念理 解的关系。 12 1 引言 1.3.2研究意义 本研究的研究意义主要可以分为以下三点。 (1)当前教育形式下,研究学生的科学推理能力是十分必要且重要的。而对科学推理能 力的考察则是研究被试科学推理能力的第一步。利用工具对被试的科学推理能力进行考察 时必须注意到测量工具的测量学指标情况,对于测量学指标较好的工具,才可应用其考察 学生的科学推理能力。而本研究将深入考察lctsr 2000科学推理能力中文版测试卷的测 量学指标,尤其对试卷的效度进行深入考察,以期为利用lctsr2000 中文版的研究者提 供参考,对于对学生科学推理能力的研究有一定的学术价值。 (2)研究lctsr2000科学推理能力中文版测试卷的测量学指标,并在此基础之上应用 该工具展开研究,考察影响学生科学推理能力的相关因素。不仅可以为相关的理论研究提 供支持,也可以帮助教育工作者来了解学生科学推理能力的水平、相关作用规律,引导教 育者更好地有针对性地帮助学生发展自身的科学推理能力,优化学习过程,具有一定的实 际意义。 (3) fci 1995 本研究还将对 ( )测试卷中文版的表述进行修订,目的在于使其更贴合英 文表述的含义,并且更符合我国物理教学的语言体系。并探讨fci 与lctsr 2000测试结 果的关系,为有关科学推理领域和fci (力学概念理解)领域的研究者提供参考。 13 2 研究方法 2方法 2.1测量工具 lctsr 2000 24 使用 科学推理能力中文版测试卷,该套试卷共计 个单项选择题,测量 了科学推理能力的六个维度,分别是:质量与体积守恒推理的能力、比例推理的能力、控 制变量推理的能力、概率推理的能力和假设演绎推理的能力。试卷中各个能力维度下的题 2 目构成可详见表 。 表2 试卷中各个能力维度下的题目构成 维度 质量与体积 比例 控制变量推 概率 相关 假设演绎 守恒推理 推理 理 推理 推理 推理 题号 1-4 5-8 9-14 15-18 19-20 21-24 lctsr2000 中文版测试卷共包含 12 个科学情境,24 道单项选择题,其中每2 道单项 2 选择题都处于同一科学情境之下。每组科学情境下的 道题目分别针对推理所得的结果和 产生推理结果的原因设立,即第1题要求学生选择该科学情境下推理所得的结果,第2 题 则要求学生说明选择结果的原因,即展示推理过程。该套试卷的计分方法分为两类: (1) 1 0 独立计分方式:对于每道题目,当被试回答正确时记 分,当被试回答错误时记 分。整份试卷得分为在被试者在该套试卷中每个题目表现情况的总和,满分24 分。 (2)成对计分方式:对于每个科学情境下的两道题目,当且仅当被试者在两道题目上的 1 0 作答情况为两道题目全部回答正确时计 分,否则计 分,整份试卷得分为被试者在该套 试卷中每个科学情境下得分的总和,满分12 分。 本研究主要采用独立计分方式对被试的测试情况进行计分。 2.2研究样本 45 fci 30 由于科学推理能力测试卷的测试时间为 分钟, 测试卷的测试时间为 分钟, 对中学阶段的学生来说,初三年级学生已经学完初中物理力学部分的相关知识,高二年级 学生已经学完高中物理力学部分的相关知识,具备开展测量的基本条件,且初三年级、高 二年级为中学阶段的关键时期,因此对上述两个年级学生的研究更具意义。但考虑到学生 课业繁忙,两份试卷对于同一学生来说作答有一定难度,且测试耗费时间较长。因此本研 究仅对较小范围的学生进行采样,以期做出探索,为进一步研究提供参考。样本的采集全 部来自于曲阜市,采样时,先在曲阜市随机抽取一所初中及两所高中,再在每个学校内选 14 2 研究方法 取两个平行班级展开测量。对初中及其中一所高中在较短时间间隔内对每位同学同时收集 科学推理能力测试的相关信息及fci 测试的相关信息,对另一所高中仅收集科学推理能力 测试的相关信息,保证在效度研究及应用研究中所得结果的可行性。本研究共对266名中 3 学生展开研究,并将研究样本分为 部分,对样本情况做简单介绍如下: (1)对曲阜市实验中学 (初中)9年级部分学生进行测量,被试为9年级3班和9年级 5班全体学生,9 年级3班与9 年级5班的学生在各方表现相似,可看做一对平行班级。 3 剔除无效答卷后,该部分样本的具体信息如表 所示。 表3 初中被试样本 班级 合计 9年级3班 9年级5班 男 27 20 47 性别 女 22 25 47 合计 49

  GB T 32610-2016_日常防护型口罩技术规范_高清版_可检索.pdf

版权所有:万博外围安全吗_官方平台app|注册链接 COPYRIGHT @ 2022 ALL RIGHT RESERVE
地址:江苏省苏州市吴中区胥口镇新峰路269号14幢-3号厂房 电话:0512-65649796 手机:18051112218 邮箱:www.qnzsk.com
苏ICP备17063611号-5 XML地图

万博外围安全吗