انواع آزمون براساس ویژگی‌های مورد اندازه‌گیری

آزمون‌های مختلف را می‌توان با توجه به ویژگی‌های گوناگونی که اندازه می‌گیرند، ابتدا به دو دسته‌ی کلی آزمون‌های توانایی و آزمون‌های عاطفی تقسیم کرد و بعد، هریک از این دو دسته را نیز به اجزای کوچک‌تری مطابق نمودار دسته‌بندی کرد:

 

آزمون‌های توانایی: آزمون‌های توانایی، آموخته‌ها، مهارت‌ها و استعدادهای افراد را می‌سنجند. دسته‌ای از این آزمون‌ها، توانایی‌های شناختی افراد را و تعدادی دیگر توانایی‌های روانی- حرکتی را اندازه می‌گیرند.

آزمون‌های توانایی به دو دسته‌ی آزمون‌های استعداد و آزمون‌های پیشرفت تحصیلی تقسیم می‌شوند. آزمون‌های استعداد توانایی یا آمادگی فرد را برای انجام دادن کارهایی که در پیش دارد و همچنین ظرفیت او را برای یادگیری‌های مختلف می‌سنجند؛ اما آزمون‌های پیشرفت تحصیلی، دانش و مهارت‌هایی را که فرد تا لحظه‌ی اجرای آزمون کسب کرده است، اندازه می‌گیرند. به سخن دیگر، آزمون‌های استعداد ناظر به آینده‌اند و برای پیش‌بینی موفقیت‌های آتی فرد به‌کار می‌روند، درحالی که آزمون‌های پیشرفت تحصیلی ناظر به گذشته‌اند و برای تعیین آموخته‌های قبلی فرد مورد استفاده قرار می‌گیرند. آزمون‌های مختلف هوش معرف آزمون‌های استعداد هستند و آزمون‌ها و امتحان‌هایی که برای موضوع‌های گوناگون درسی تهیه می‌شوند، آزمون‌های پیشرفت تحصیلی به حساب می‌آیند.

آزمون‌های عاطفی: آزمون‌های عاطفی ویژگی‌های عاطفی و شخصیتی افراد را می‌سنجند. آزمون‌های توانایی حداکثر عملکرد آزمون شونده را اندازه می‌گیرند؛ بدین معنی که نشان می‌دهند آزمون شونده در بهترین شرایط قادر به انجام چه کاری است، در حالی که آزمون‌های عاطفی وضع موجود آزمون شونده را در موقعیت‌های طبیعی زندگی می‌سنجند. یکی دیگر از وجوه اختلاف آزمون‌های عاطفی با آزمون‌های توانایی آن است که آزمون‌های توانایی به‌طور عمده برای مقاصد پیش‌بینی موفقیت‌های تحصیلی و شغلی مورد استفاده قرار می‌گیرند، اما آزمون‌های عاطفی بیشتر به امور مشاوره در حل مسائل روانی، تربیتی و حرفه‌ای کمک می‌کنند.

انواع آزمون با توجه به روش تهیه

از این منظر، آزمون‌ها به دو دسته‌ی عمده‌ی «آزمون‌های استاندارد شده» و «آزمون‌های معلم‌ساخته» تقسیم می‌شوند:

آزمون‌های استاندارد شده: آزمون‌های استاندارد شده، آزمون‌هایی هستند که با استفاده از نمونه‌های بزرگِ آزمون‌شوندگان و غالباً به وسیله‌ی مؤسسه‌های آزمون‌سازیِ دولتی یا خصوصی و یا مراکز آموزشی و علمی، برای اندازه‌گیری پیشرفت تحصیلی با مقاصد ارزشیابی از دوره‌های تحصیلی، تهیه و توزیع می‌شوند. در این نوع آزمون‌ها، ملاکِ نسبی اندازه‌گیری مورد استفاده قرار می‌گیرد.

آزمون‌های معلم‌ساخته: آزمون‌های معلم‌ساخته آزمون‌هایی هستند که معلمان برای سنجش پیشرفت تحصیلی دانش‌آموزان خود تهیه می‌کنند و در طول دوره‌ی آموزش و یا در پایان دوره به اجرا درمی‌آورند. در این آزمون‌ها، ملاکِ مطلق اندازه‌گیری مورد استفاده قرار می‌گیرد.

تفاوت آزمون‌های استاندارد شده و معلم ساخته

نخست این‌که: تهیه‌ی آزمون‌های استاندارد شده در مقایسه با آزمون‌های معلم ساخته به زمان و تخصص بیشتری نیاز دارد. از آن‌جا که این آزمون‌ها برای بیش از یک بار استفاده تهیه می‌شوند، مؤسسات آزمون‌ساز، برای تهیه‌ی آن‌ها زمان و هزینه‌ی زیادی به‌کار می‌گیرند. در تهیه‌ی این آزمون‌ها برنامه‌های درسی مورد بررسی دقیق واقع می‌شوند، محتوای درس‌ها و مهارت‌های مورد اندازه‌گیری نمونه‌گیری می‌شوند، سؤال‌ها به وسیله‌ی متخصصان نوشته و ویرایش می‌شوند، صورت مقدماتی آزمون به‌طور آزمایشی اجرا می‌شود، سؤال‌ها تجزیه و تحلیل می‌شوند و مورد تجدیدنظر قرار می‌گیرند و پس‌ از هنجاریابی، صورت نهایی آزمون تهیه و جهت استفاده‌ی گسترده عرضه می‌شود. اما برای تهیه‌ی آزمون‌های معلم‌ساخته نیازی به گذر از این مراحل مفصل نیست، زیرا این آزمون‌ها برای تعیین مقدار یادگیری دانش‌آموزان در درس‌های بخصوص تهیه و اجرا می‌شود و پس‌از هر بار اجرا به سهولت قابل تجدیدنظر و اصلاح هستند.

دوم این‌که: از آن‌جا که آزمون‌های استاندارد شده برای استفاده در مناطق مختلف و مقایسه‌ی دانش‌آموزان مدارس مناطق گوناگون با یکدیگر تهیه می‌شوند، هدف‌های مختلف آموزشی مناطق مختلف را باید در این آزمون‌ها منظور کرد. اما آزمون‌های معلم‌ساخته با توجه به محتوا و هدف‌های ویژه‌ی درس‌های بخصوص تهیه می‌شوند.

سوم این‌که: اصطلاح «آزمون استاندارد شده یا میزان شده» به وجود داده‌های هنجاری اشاره می‌کند، و ناشران این نوع آزمون‌ها برای معنی‌دار کردن نمرات آزمون خود هنجارهای لازم را تدارک می‌بینند. اما آزمون‌های معلم ساخته نیازی به هنجار و هنجاریابی ندارند. مقایسه‌ی بین گروه‌های مختلف دانش‌آموزان که به وسیله‌ی آزمون‌های استاندارد شده سنجش می‌شوند، وجود هنجارها را در این نوع آزمون‌ها ضروری می‌سازد. بنابراین، هدف اصلی آزمون‌های استاندارد شده مقایسه است، مقایسه‌ی یک فرد یا یک گروه با فرد یا گروه دیگر، یا مقایسه‌ی جنبه‌های مختلف عملکرد یک فرد یا یک گروه با خودش.

روایی آزمون

روایی0 اصطلاحی است که به هدفی که آزمون برای تحقق بخشیدن به آن درست شده است، اشاره می‌کند. بنابر آن‌چه گفته شد، آزمونی دارای روایی است که برای اندازه‌گیری آن‌چه مورد نظر است، کافی و مناسب باشد. برای مثال، یک آزمون پیشرفت تحصیلی ریاضی کلاس پنجم دبستان، درصورتی یک آزمون روا است که محتوا و هدف‌های آن درس را به‌خوبی اندازه‌گیری کند و به‌جز یادگیری دانش‌آموزان از آن درس، چیز دیگری را شامل نباشد.

آزمون‌های مورد استفاده در آموزش و پرورش و روانشناسی دارای سه هدف عمده هستند که به سه پرسش زیر پاسخ می‌دهند:

  • آیا سؤال‌های آزمون از محتوای درس یا موضوع مورد نظر یک نمونه‌ی خوب ارایه می‌دهد؟
  • آیا نمرات آزمون عملکرد فعلی یا آتی دانش‌آموزان را پیش‌بینی می‌کند؟
  • آیا نمرات آزمون به مفاهیم نظری یا سازه‌هایی که آزمون برای سنجش آن‌ها درست شده، مربوط است؟

سه مورد فوق به ترتیب سه نوع روایی محتوایی، ملاکی و سازه را نشان می‌دهد.

عوامل مؤثر بر روایی آزمون

عوامل درونی: نخستین عاملی که می‌تواند بر روایی آزمون تأثیر بگذارد دستورالعمل یا راهنمای آزمون است. راهنماهایی که دقیقاً به آزمون‌شوندگان نمی‌گویند چگونه به سؤال‌ها پاسخ دهند و چگونه پاسخ خود را ثبت نمایند، سطح روایی آزمون را کاهش می‌دهند. عامل دیگری که بر روایی آزمون تأثیر بسزایی دارد کیفیت سؤال‌های آزمون است. سؤال‌هایی که طبق قواعد درست سؤال‌نویسی تهیه شده‌ باشند به روایی آزمون می‌افزایند و برعکس سؤال‌هایی که از هر لحاظ مشکل داشته باشند به روایی آزمون لطمه می‌زنند. علاوه بر این هر کدام از سؤال‌های آزمون که از هدف اصلی آزمون جدا می‌افتد و چیزی جدا از آن را شامل می‌شود نیز به سهم خود از روایی کل آزمون می‌کاهد. همچنین واژگان و جمله‌بندی پیچیده که از حد درک آزمون شوندگان فراتر باشد به روایی آزمون لطمه می‌زند. عامل درونی دیگری که بر روایی آزمون تأثیر دارد ترتیب قرار گرفتن سؤال‌های آزمون به دنبال یک‌دیگر است. قرار دادن سؤال‌های بسیار دشوار در آغاز آزمون ممکن است سبب شود که پاسخ دهندگان به آزمون نتوانند وقت خود را برای بخش‌های مختلف آزمون به درستی تقسیم کنند. همچنین اگر سؤال‌های مختلف آزمون از لحاظ درجه‌ی دشواری متنوع نباشند، روایی آزمون صدمه می‌بیند. آزمون‌هایی که دارای مجموعه سؤال‌های بسیار دشوار یا بسیار ساده‌اند از سطح روایی خوبی برخوردار نیستند. از عوامل دیگر مؤثر بر روایی، طول یک آزمون یا تعداد سؤال‌های آن است. یکی دیگر از راه‌های بالا بردن سطح روایی آزمون افزایش تعداد سؤال‌های آن است. علاوه بر این، در آزمون‌هایی که با روایی محتوایی معرفی می‌شوند، هر چه تعداد سؤال‌ها بیش‌تر باشد نمونه‌ی بهتری از محتوای مورد اندازه‌گیری را شامل خواهند بود و به همان نسبت به روایی آزمون افزوده می‌شود.

عوامل بیرونی: علاوه بر عوامل درونی، چندین عامل بیرونی نیز وجود دارند که بر روایی آزمون‌ها تأثیر می‌گذارند و برای افزایش دادن سطح روایی یک آزمون می‌توان آن‌ها را کنترل کرد. یکی از این عوامل بیرونی اجرای نامناسب آزمون است. کمبود زمان، فضای نامناسب، مکان نامناسب و مانند این‌ها از عوامل اجرایی هستند که بر عملکرد آزمون‌شوندگان و در نتیجه بر روایی آزمون تأثیر نامطلوبی به جای می‌گذارند. علاوه بر اجرای نامناسب آزمون، اشکالات موجود در تصحیح پاسخ‌های آزمون‌شوندگان و نمره‌گذاری آن‌ها به ویژه در آزمون‌های تشریحی می‌تواند نتایج حاصل را مخدوش سازد و لذا از روایی آزمون بکاهد. عامل دیگر مؤثر بر روایی آزمون ترکیب آزمون‌شوندگان از لحاظ توانایی مورد اندازه‌گیری است. هر چه گروه آزمون‌شوندگان از لحاظ توانایی مورد اندازه‌گیری نامتجانس‌تر باشند روایی آزمون بیش‌تر خواهد بود. به همین دلیل آزمون‌هایی که وقتی با گروه‌های نامتجانس به کار می‌روند دارای روایی قابل ملاحظه‌ای هستند اگر با گروه‌های دارای تجانس بیش‌تر به کار گرفته شوند سطح روایی کم‌تری از خود نشان خواهند داد. علاوه بر عوامل فوق، ویژگی‌های روانی آزمون شوندگان نیز می‌توانند بر روایی نمرات حاصل از یک آزمون تأثیر داشته باشند. برای نمونه، بالا و پایین بودن سطح انگیزش آزمون‌شوندگان یا علاقه‌مند بودن و بی‌علاقه بودن آنان نسبت به پاسخ دادن به سؤال‌های آزمون و نیز کمی یا زیادی سطح اضطراب آنان بر نمرات حاصل و لذا بر میزان روایی تأثیر می‌گذارد. علاقه‌مندی آزمون شوندگان به شرکت در آزمون و پایین بودن سطح اضطراب، بر دقت آنان و روایی نتایج آزمون تأثیر مثبت به جای می‌گذارد، اما بی‌علاقگی یا نفرت آزمون‌شوندگان یا اضطراب زیاد آنان در جلسه‌ی آزمون هم بر دقت عمل و هم بر روایی نتایج حاصل تأثیر منفی دارد.

دسته‌بندی ارزشیابی‌های پیشرفت تحصیلی

ارزشیابی به تمام روش‌هایی اشاره دارد که در مدارس برای اندازه‌گیری رسمی عملکرد دانش‌آموزان مورد استفاده قرار می‌گیرند. از جمله‌ی این روش‌ها، امتحانات مستمر و امتحانات پایانی، ارزیابی‌های کتبی و نمرات هستند. معمولاً ارزشیابی دانش‌آموز بر پیشرفت تحصیلی تمرکز دارد، ولی خیلی از مدارس، رفتارها و روش‌ها را نیز ارزیابی می‌‌کنند و ضمناً تعدادی از مدارس ابتدایی توصیفاتی را از رفتار دانش‌آموز در اختیار می‌گذارند، مانند «از دستورات پیروی می‌کند»، «با دقت گوش می‌دهد»، « با دیگران کار می‌کند» و «از زمان عاقلانه استفاده می‌کند». در دوره‌های راهنمایی، متوسطه و پیش‌دانشگاهی، رواج گزارش‌های رفتار به ترتیب کاهش می‌یابد ولی خیلی از دبیرستان‌ها، دانش‌آموزان را طبق ملاک‌هایی چون «توانایی‌اش بهبود می‌یابد»، «آمادگی دارد» و «وظیفه‌شناس است»، ارزشیابی می‌کنند. ارزشیابی دانش‌آموزان شش هدف اصلی دارد:

 

دسته‌بندی ارزشیابی‌های پیشرفت تحصیلی با توجه به موضوع

ارزشیابی از دانش‌آموزان: ارزشیابی از دانش‌آموزان عمدتاً به معنی ارزشیابی از پیشرفت تحصیلی یا ارزشیابی از میزان یادگیری آنان است. استفاده از نتایج ارزشیابی دانش‌آموزی به‌ویژه نتایج ارزشیابی پیشرفت تحصیلی، نه‌تنها برای قضاوت درباره‌ی عملکرد یادگیرندگان، بلکه برای داوری درباره‌ی اثربخشی کیفیت آموزش، روش‌ها و مواد آموزشی نیز مفید است. ارزشیابی پیشرفت تحصیلی که مهم‌ترین نوع ارزشیابی آموزشی است، تعیین می‌نماید که دانش‌آموزان تا چه میزانی به هدف‌های آموزشی از پیش تعیین شده رسیده‌اند.

ارزشیابی از برنامه‌های درسی و مواد آموزشی: ارزشیابی آموزشی، گاهی به منظور تعیین اثربخشی برنامه‌ی درسی یا مواد آموزشی انجام می‌شود و شامل ارزشیابی از عواملی چون روش‌های آموزشی، کتاب‌های درسی، ابزارهای دیداری- شنیداری و تدارکات فیزیکی و سازمانی است. در ارزشیابی از برنامه‌های درسی و مواد آموزشی نیز عمده‌ترین ملاک، پیشرفت تحصیلی یا میزان یادگیری دانش‌آموزان است.

ارزشیابی از پروژه‌ها و برنامه‌های آموزشی: علاوه بر برنامه‌های درسی و مواد آموزشی، برنامه‌ها و پروژه‌های آموزشی ویژه نیز مورد ارزشیابی واقع می‌شوند. منظور از پروژه‌ها و برنامه‌های آموزشی ویژه، کوشش‌هایی است که به‌عنوان بخشی از برنامه‌های معمول مدرسه‌ها به‌حساب نمی‌آیند. این برنامه‌ها نوعاً ماهیت نوآورانه دارند و طول مدت حضورشان به موفقیتشان وابسته است.

ارزشیابی از مدرسه: منظور از ارزشیابی از مدرسه این است که تعیین شود هدف‌های پیش‌بینی شده برای مدرسه به چه میزانی تحقق یافته‌اند و نقاط قوت و ضعف کدام‌اند. یکی از جنبه‌های مهم ارزشیابی از مدرسه، برنامه‌ی آزمون مدرسه است. هرچه این برنامه جامع‌تر و کامل‌تر باشد، اطلاعات به دست آمده نیز به همان نسبت، قابل اعتمادتر و باارزش‌تر خواهد بود. مانند سایر ارزشیابی‌های آموزشی، در ارزشیابی از مدرسه نیز پیشرفت تحصیلی دانش‌آموزان مهم‌ترین بخش برنامه‌ی آزمون و منبع کسب اطلاعات است.

ارزشیابی از کارکنان مدرسه: مقصود از ارزشیابی از کارکنان مدرسه، ارزشیابی از همه‌ی کسانی است که به‌طور مستقیم یا غیرمستقیم مسئول بازده‌ آموزشی مدرسه هستند. شاید پیچیده‌ترین نوع ارزشیابی، ارزشیابی از کار معلمان باشد. علت پیچیدگی این روش ارزشیابی، کم‌اعتباری و بی‌دقتی وسایل و روش‌های اندازه‌گیری و سنجش مورد استفاده در این نوع ارزشیابی است؛ زیرا هیچ‌یک از منابع اطلاعاتی، اطلاعات دقیق و بی‌غرضانه‌ای را که برای یک ارزشیابی سالم، ضروری است، به دست نمی‌دهد. بنابراین، متخصصان ارزشیابی معلم پیشنهاد می‌کنند برای این‌که ارزشیابی سالم‌تری از معلمان به‌عمل آید، باید از همه‌ی منابع اطلاعاتی موجود داده‌های لازم را به دست آورد و قضاوت نهایی را بر اساس ترکیبی از آن‌ها انجام داد.

دسته‌بندی ارزشیابی‌های پیشرفت تحصیلی با توجه به ملاک مورد استفاده:

ارزشیابی وابسته به ملاک: در این ارزشیابی که ارزشیابی ملاکی نامیده می‌شود، معیار یا ملاک ارزشیابی از پیش تعیین می‌شود و عملکرد یادگیرنده با توجه به آن ملاک مورد قضاوت قرار می‌گیرد. این نوع ارزشیابی تعیین می‌کند که آیا دانش‌آموزان مطالب و هدف‌هایی را که قرار بوده است بیاموزند، آموخته‌اند یا نه.

ارزشیابی وابسته به هنجار: این نوع ارزشیابی به جای یک ملاک مطلق از پیش تعیین شده بر نوعی ملاک نسبی وابسته است. در این نوع ارزشیابی می‌توان تعیین کرد که پیشرفت یک دانش‌آموز نسبت به دانش‌آموزان دیگر چه وضعی دارد.

دسته‌بندی ارزشیابی‌های پیشرفت تحصیلی با توجه به زمان و هدف استفاده

ارزشیابی آغازین یا سنجش آغازین: نخستین ارزشیابی که پیش از انجام فعالیت‌های آموزشی به اجرا درمی‌آید، ارزشیابی آغازین یا سنجش آغازین نامیده می‌شود. این نوع ارزشیابی به دو منظور مورد استفاده قرار می‌گیرد:
1- آیا دانش‌آموزان بر دانش‌ها و مهارت‌های پیش‌نیاز درسِ تازه از قبل مسلط‌‌اند؟
2- دانش‌آموزان چه مقدار از هدف‌ها و محتوای درس تازه را قبلاً یاد گرفته‌اند؟
در مورد سؤال اول، سنجش آغازین به منظور اندازه‌گیری مهارت‌ها و دانش‌های پیش‌نیاز یادگیریِ درس تازه به‌کار می‌رود. در مورد سؤال دوم، به‌جای آزمون آمادگی، از آزمون جایابی یا آزمون پایه‌گزینی81 استفاده می‌شود. هدف از آزمون جایابی یا پایه‌گزینی که به آن پیش‌آزمون نیز گفته می‌شود، تعیین میزان اطلاعات یادگیرندگان از مطالبی است که قرار است به آنان آموزش داده شود.

ارزشیابی تکوینی: آن‌چه عمدتاً به‌منظور کمک به اصلاح موضوع مورد ارزشیابی، یعنی برنامه یا روش آموزشی مورد استفاده قرار می‌گیرد، ارزشیابی تکوینی نام دارد. هدف از اجرای این ارزشیابی، آگاه ساختن تولید کنندگان برنامه از نواقص برنامه‌ی خود و کمک به اصلاح آن‌ها است. هدف از کاربرد ارزشیابی تکوینی در رابطه با پیشرفت تحصیلی دانش‌آموزان، آگاهی یافتن از میزان و نحوه‌ی یادگیری آنان برای تعیین نقاط قوت و ضعف یادگیری و نیز، تشخیص مشکلات روش آموزش معلم در رابطه با هدف‌های آموزشی است.

ارزشیابی تشخیصی: نوع دیگر ارزشیابی که آن نیز در جریان آموزش انجام می‌گیرد، ارزشیابی تشخیصی نام دارد. علت این نام‌گذاری آن است که این ارزشیابی با هدف تشخیص مشکلات یادگیری دانش‌آموزان به‌کار می‌رود. این آزمون‌ها معمولاً به صورت انفرادی اجرا می‌شوند و در قیاس با آزمون‌های پیشرفت تحصیلی، سؤال‌های بیشتری را در بر می‌گیرند. این ارزشیابی زمانی مورد استفاده قرار می‌گیرد که معلم با مشکلات مبرم و مکرری در یک یا چند دانش‌آموز روبه‌رو می‌شود، که با روش‌های اصلاحیِ معمولِ ارزشیابی تکوینی قابل رفع نیست.

ارزشیابی تراکمی: در ارزشیابی تراکمی تمام آموخته‌های دانش‌آموزان در طول یک دوره‌ی آموزشی سنجش می‌شوند و هدف آن، نمره دادن به دانش‌آموزان و قضاوت درباره‌ی اثربخشی کار معلم و برنامه‌ی درسی یا مقایسه‌ی برنامه‌های مختلف درسی با یکدیگر است. هدف ارزشیابی تراکمی هم نمره دادن و اتخاذ تصمیم‌های مختلف و هم تعیین اثربخشی طرح آموزشی و هدف‌های معلم و میزان موفقیت او در پیاده کردن مراحل مختلف طرح آموزشی است.

دسته‌بندی ارزشیابی‌های پیشرفت تحصیلی با توجه به ارزشیابان

دو نوع ارزشیابی آموزشی دیگر که با ارزشیابی تکوینی و تراکمی رابطه‌ی نزدیکی دارند، ارزشیابی درونی12 و ارزشیابی بیرونی22 است. منظور از ارزشیابی درونی، این است که ارزشیابی توسط کارکنان و دست‌اندرکاران تهیه و اجرای برنامه، یعنی افراد درون برنامه انجام می‌شود و منظور از ارزشیابی بیرونی، ارزشیابی توسط افراد یا گروه‌هایی خارج از برنامه صورت گیرد. مک بیت و مک گلین (2002) هر دو نوع ارزشیابی درونی و بیرونی را ضروری می‌دانند و ارتباط بین آن‌ها را مطابق شکل زیر نشان داده‌اند. دقت کنید که در این شکل مدرسه در مرکز قرار داده شده، برای این‌که تأکید شود که خودِ مدرسه نیروی محرک اصلی برای ارزشیابی است.

 

بنابراین، مدرسه باید به این پرسش‌ها پاسخ دهد: ما تا چه اندازه خوب هستیم؟ از کجا می‌دانیم؟ لایه‌ی آخر نشان‌دهنده‌ی ارزشیابی در سطح بین‌المللی است. سؤالی که در این‌جا مطرح است، این است که «در مقایسه با سایر کشورها وضع ما چگونه است؟» مانند آزمون‌های تیمز و پرلز.

سنجش یادگیری دانش‌آموزان

مهم‌ترین وسیله‌ی سنجش پیشرفت تحصیلی دانش‌آموزان، آزمون است؛ البته باید در نظر داشت که آزمون‌های پیشرفت تحصیلی متداول که به آزمون‌های کتبی یا آزمون‌های مداد و کاغذی معروف‌اند، به‌طور عمده با حوزه‌ی شناختی سر و کار دارند. هدف‌های آموزشی و بازده‌های یادگیری متعلق به حوزه‌های غیرشناختی، ازجمله نگرش‌ها، علاقه‌ها و ارج نهادن‌ها (هدف‌های حوزه‌ی عاطفی) و مهارت‌های مختلف مانند انجام آزمایش در آزمایشگاه، کار در کارگاه، فعالیت‌های ورزشی، و ایجاد ارتباط کلامی و غیرکلامی (هدف‌های حوزه‌ی روانی – حرکتی) به کمک وسایل دیگر سنجش ازجمله: مشاهده، مقیاس درجه‌بندی، فهرست وارسی، واقعه‌نگاری، ثبت حضور و غیاب، گزارش‌های کار عملی، و مانند این‌ها سنجش می‌شوند.

جدول مشخصات آزمون

مهم‌ترین گام در تهیه‌ی آزمون‌های پیشرفت تحصیلی، تهیه‌ی جدول مشخصات برای موضوعی است که قرار است آزمون آن تهیه شود. جدول مشخصات یک جدول دوبعدی است با تعدادی ردیف و ستون، متناسب با محتوا و هدف‌های آموزشی درس. در ردیف بالای جدول که بُعدِ محتوا نام دارد، اجزای مطالب درسی نوشته می‌شوند و در ستون کنار آن که بُعدِ هدف نامیده می‌شود، فهرست هدف‌های آموزشی قرار می‌گیرد.

یک آزمون خوب پیشرفت تحصیلی آزمونی است که به بهترین شکل منعکس کننده‌ی تمامی هدف‌های آموزشی و همه‌ی محتوای برنامه‌ی درسی باشد. از لحاظ نظری، بهترین آزمون برای یک درس یا یک موضوع آزمونی است که تمام مطالب و کلیه‌ی هدف‌های آموزشی آن درس را شامل شود. اما اگر درس یا موضوع، مفصل باشد، تهیه‌ی چنین آزمونی غیرعملی است. بنابراین، به‌جای گنجانیدن همه‌ی سؤال‌های ممکن تهیه کننده‌ی آزمون به انتخاب تعدادی سؤال نمونه که معرف هدف‌ها و محتوای درس باشد، اقدام می‌کند. درصورتی چنین آزمونی یک آزمون خوب یا به اصطلاح یک آزمون دارای روایی خواهد بود که سؤال‌های آن حاوی نمونه‌ی درستی از هدف‌ها و محتوای درس باشد.

بعد از تکمیل بُعد محتوا و بُعد هدف جدول مشخصات، آزمون‌ساز باید تعیین کند که سؤال‌های آزمون خود را به چه صورتی در میان هدف‌ها و عنوان‌های درس توزیع نماید؛ یعنی تعداد سؤال‌هایی را که به هر یک از موضوع‌های درسی و هدف‌های آموزشی اختصاص خواهند داشت، تعیین نماید و این تعداد را یا به صورت تعداد واقعی سؤال‌ها یا به صورت درصد، در خانه‌های جدول مشخصات وارد کند. برای تعیین درصد سؤال‌هایی که به بخش‌های مختلف محتوا و هدف‌ها تعلق می‌گیرند، جواب سؤال‌های زیر را باید تعیین کرد:

  • کدام بخش از محتوا و کدام دسته از هدف‌ها دارای حجم بیشتری است و وقت بیشتری صرف آموزش آن‌ها شده است؟
  • کدام هدف‌ها از لحاظ نگهداری در حافظه و کاربرد در آینده، ارزش بیشتری دارند؟
  • کدام قسمت یا قسمت‌های درس یا موضوع درسی از اهمیت بیشتری برخوردارند؟

انواع آزمون‌های پیشرفت تحصیلی کتبی

آزمون‌های پیشرفت تحصیلی کتبی را می‌توان ابتدا به دو دسته‌ی بسته‌پاسخ و بازپاسخ تقسیم کرد و سپس این دو دسته‌ی کلی را نیز تقسیم نمود. آزمون‌های بسته‌پاسخ آزمون‌هایی هستند که هم سؤال‌ها و هم جواب سؤال‌ها را در اختیار آزمون‌شوندگان قرار می‌دهند و آزمون‌شوندگان درباره‌ی جواب‌های داده شده اعمالی انجام می‌دهند یا تصمیم‌هایی اتخاذ می‌کنند.

در تصحیح برگه‌های آزمون‌های بسته‌پاسخ نظر شخصی مصحح هیچ‌گونه دخالتی ندارد و از این رو به این آزمون‌ها آزمون‌های عینی می‌گویند.

آزمون‌های بازپاسخ آزمون‌هایی هستند که دانش‌آموز، خودش پاسخ خواسته شده را می‌سازد یا تولید می‌کند. آزمون‌های تشریحی، آزمون‌های کوته‌پاسخ، امتحانات شفاهی انفرادی، تولید آثار هنری (شعر، موسیقی، نقاشی)، انجام پروژه‌های تحقیقی از این جمله‌اند. این نوع آزمون‌ها را نیز می‌توان به دو دسته‌ی آزمون‌های گسترده پاسخ و آزمون‌های محدودپاسخ تقسیم کرد. شکل زیر انواع آزمون‌های پیشرفت تحصیلی کتبی را نشان می‌دهد:

 

آزمون‌های تشریحی

آزمون‌های تشریحی را با توجه به آزادی عمل دانش‌آموزان در پاسخ دادن به سؤال‌های آزمون، به دو دسته‌ی گسترده‌پاسخ (مانند آزمون درس انشا) و محدودپاسخ (مانند آزمون درس ریاضی) تقسیم می‌کنند که محاسن این آزمون‌ها به این شرح است:

  • تهیه‌ی آزمون‌های تشریحی از تهیه‌ی آزمون‌های بسته‌پاسخ آسان‌تر است.
  • این نوع آزمون بهترین وسیله‌ی سنجش توانایی دانش‌آموزان در پروراندن جواب سؤال‌ها و بیان آنها است.
  • این آزمون‌ها توانایی پاسخ دادن به سؤال‌ها را می‌سنجند نه توانایی انتخاب پاسخ‌ها را.
  • آنها موقعیت‌های واقعی‌تری را از آزمون‌های بسته‌پاسخ به دانش‌آموزان عرضه می‌کنند.
  • آنها بر روش مطالعه‌ی دانش‌آموزان تأثیر مثبت به‌جای می‌گذارند. اگر دانش‌آموزان از پیش بدانند که با استفاده از آزمون‌های تشریحی، یادگیری آنان سنجش خواهد شد، با احتمال بیشتری به دنبال روابط در میان مطالب به جستجو خواهند پرداخت و اطلاعات را به راه‌های معنی‌دار سازمان خواهند داد.

معایب آزمون‌های تشریحی به شرح زیر است:

  • این آزمون‌ها با توجه به محدود بودن تعداد سؤالات آزمون، نمونه‌ی کوچکی از محتوای درس و هدف‌های آموزشی را اندازه می‌گیرند.
  • تصحیح برگه‌های امتحانی این‌گونه آزمون‌ها نمی‌تواند با دقت و در شرایط یکسان انجام گیرد.
  • تصحیح برگه‌های امتحانی این آزمون‌ها بسیار وقت‌گیر است.

آزمون‌های کوته پاسخ

آزمون‌های کوته پاسخ برای اندازه‌گیری هدف‌های شناختی سطوح پایین، به‌ویژه دانش یا معلومات، مفید هستند. البته در پاره‌ای از اوقات از این نوع سؤال‌ها برای اندازه‌گیری هدف‌های سطح بالاتر نیز می‌توان استفاده کرد. یکی از محاسن آزمون‌های کوته‌پاسخ، سهولت تهیه‌ی سؤال‌ها و تصحیح پاسخ‌های آن‌ها است. علاوه بر این، در مقایسه با آزمون‌های بسته‌پاسخ، نظیر آزمون‌های صحیح ـ غلط یا چندگزینه‌ای دارای مزایای دیگری به شرح زیر هستند:

  • اجرای آن‌ها آسان است.
  • امکان تقلب را کاهش می‌دهند.
  • نسبت به آزمون‌های چندگزینه‌ای، صحیح- غلط و جور کردنی اطلاعات تشخیصی بیشتری را در اختیار معلمان می‌گذارند.
  • امتیاز دیگر آزمون‌های کوته‌پاسخ این است که در آن‌ها حدس کورکورانه که از معایب عمده‌ی آزمون‌های بسته‌پاسخ است، وجود ندارد.

از معایب این آزمون‌ها کاربرد محدود آن‌ها است. از آن‌جا که پاسخ سؤال‌های این نوع آزمون‌ها بسیار مختصر است، نمی‌توان از آن‌ها برای سنجش هدف‌های سطح بالای یادگیری استفاده کرد و کاربرد آن‌ها به انداز‌ه‌گیری هدف‌های سطح دانش و حداکثر فهمیدن و کاربستن (آن هم در موارد بسیار نادر) محدود می‌شود. مشکل دیگر این است که کاربرد زیاد این آزمون‌ها سبب تشویق دانش‌آموزان به حفظ کردن اطلاعات جزئی و بی‌اهمیت خواهد شد، زیرا در این نوع آزمون‌ها بیشتر این‌گونه اطلاعات سنجیده می‌شود.

آزمون‌های صحیح ـ غلط

در آزمون‌های صحیح- غلط تعدادی سؤال یا جمله در اختیار دانش‌آموزان گذاشته می‌شود و او صحیح و غلط بودن آنها را تعیین می‌کند. سؤال‌های صحیح- غلط ساده‌ترین صورت‌ سؤال‌های بسته‌پاسخ هستند و به‌طور کلی می‌توان محاسن این آزمون‌ها را به شرح زیر فهرست کرد:

  • بیان موضوع‌های درسی در قالب عبارت‌های ساده.
  • سادگی تهیه.
  • عینی بودن تصحیح جواب‌ها.
  • قابلیت پاسخگویی آزمون‌شونده به تعداد زیادی سؤال در هر جلسه‌ی امتحان.

آزمون‌های صحیح ـ غلط را از جهاتی مورد انتقاد قرار داده‌اند و ایرادهایی به آن‌ها وارد کرده‌اند. ایرادهای وارده به این آزمون‌ها را می‌توان به شرح زیر برشمرد:

  • این آزمون‌ها اغلب برای سنجش اطلاعات جزئی و کم‌اهمیت به‌کار می‌روند.
  • حدس زدن کورکورانه در آن‌ها خیلی زیاد دخالت دارد.
  • کاربرد زیاد آن‌ها سبب تأکید بی‌مورد بر حفظ طوطی‌وار اطلاعات کم‌اهمیت می‌شود.
  • آن‌ها بیشتر برای سنجش هدف‌های سطح پایین مفیداند و توانایی‌های پیچیده‌ی سطح بالا را اندازه نمی‌گیرند.

آزمون‌های جورکردنی

آزمون‌های جور کردنی از تعدادی سؤال تشکیل می‌شوند که هریک از آن‌ها شامل دو ستون است. یک ستون، معرف پرسش‌ها و ستون دیگر نشان‌دهنده‌ی پاسخ‌ها است. وظیفه‌ی دانش‌آموز آن است که پاسخ‌ها را با پرسش‌های مربوط جور کند. فایده‌ها و کاربردهای سؤال‌های جور کردنی را به نحو زیر می‌توان خلاصه کرد:

  • از آن‌جا که پاسخ دادن به این سؤال‌ها زمان زیادی لازم ندارد، تعداد زیادی از آن‌ها را می‌توان در یک زمان معین مورد استفاده قرار داد.
  • تصحیح سؤال‌های جورکردنی به سرعت و سهولت امکان‌پذیر است و نیازی به مصحح متخصص ندارد.

آن‌جا که بازده یادگیری بر توانایی تشخیص روابط بین امور تأکید دارد و می‌توان تعدادی پرسش و پاسخ متجانس یافت، سؤال‌های جورکردنی مهم‌ترین نوع سؤال‌ها هستند. معایب این آزمون‌ها را به صورت زیر می‌توان خلاصه کرد:

  • از آن‌جا که در یادگیری تداعی بین امور، حفظ طوطی‌وار دخالت زیادی دارد و معلمان غالباً در تهیه‌ی این نوع سؤال‌ها بر روابط حفظی بین امور تأکید می‌کنند، این آزمون‌ها اگر به دقت تهیه نشود، ممکن است دانش‌آموزان را به یادگیری مطالب سطحی و غیرعمقی سوق دهد.
  • گاهی اوقات پیدا کردن مجموعه‌ای از پرسش‌ها که به اندازه‌ی کافی شبیه به هم باشد تا بتوان برای آن‌ها پاسخ‌های همگونی پیدا کرد، کار دشواری است.

آزمون‌های چندگزینه‌ای

آزمون چند گزینه‌ای شامل تعدادی سؤال است که هریک از آن‌ها از یک قسمت اصلی و تعدادی گزینه (پاسخ) تشکیل می‌شود و دانش‌آموز از میان گزینه‌های پیشنهادی، گزینه‌ی صحیح را انتخاب می‌کند.

آزمون‌های چندگزینه‌ای تمام محاسن آزمون‌های صحیح ـ غلط و جورکردنی را دارد. علاوه بر آن، این آزمون‌ها قادر به اندازه‌گیری غالب بازده‌های یادگیری از دانش گرفته تا فهمیدن، قضاوت کردن، حل مسأله، ارایه‌ی پیشنهادهای عملی و پیش‌بینی امور هستند. تقریباً هرگونه درک و فهم یا توانایی را که بتوان با آزمون‌های دیگر- کوته‌پاسخ، کامل کردنی، صحیح غلط، جورکردنی یا تشریحی- اندازه گرفت، می‌توان با آزمون‌های چندگزینه‌ای سنجش کرد.

به‌طور کلی محاسن آزمون‌های چندگزینه‌ای را می‌توان به شرح زیر بیان کرد:

  • این آزمون‌ها از سایر آزمون‌های بسته‌پاسخ، انعطاف‌پذیرترند. آنها علاوه بر دانش، توانایی استدلال، قضاوت و بسیاری بازده‌های مهم دیگر یادگیری را می‌سنجند.
  • با استفاده از سؤال‌های چندگزینه‌ای می‌توان در یک زمان محدود تعداد زیادی از هدف‌های آموزشی و بخش مهمی از محتوای درس را اندازه‌گیری کرد.
  • آزمون‌های چندگزینه‌ای نسبت به آزمون‌های صحیح- غلط کمتر امکان حدس زدن کورکورانه را به آزمون‌شوندگان می‌دهند.
  • پاسخ‌های این سؤال‌ها به سادگی و با عینیت کامل قابل تصحیح هستند.
  • دانش‌آموزان و معلمان این نوع آزمون‌ها را به سایر آزمون‌های بسته‌پاسخ ترجیح می‌دهند.
  • اگر گزینه‌های انحرافی این آزمون‌ها با توجه به اشتباهات و کج‌فهمی‌های متداول دانش‌آموزان تهیه شوند، منبع بسیار مناسبی برای تشخیص مشکلات دانش‌آموزان خواهند بود.

آزمون‌های چندگزینه‌ای از چند نظر مورد انتقاد قرار گرفته‌اند. ما در این‌جا این انتقادها را به‌عنوان معایب آزمون‌های چندگزینه‌ای ذکر می‌کنیم.

  • ساختن این آزمون‌ها بسیار دشوار است. معلمان غالباً نمی‌توانند تعدادی گزینه‌ی انحرافی خوب برای سؤال‌های چندگزینه‌ای انتخاب کنند.
  • معلمان اغلب سؤال‌های چندگزینه‌ای را در حد سنجش اطلاعات جزیی و کم‌اهمیت می‌نویسند. البته این ایرادی است که به همه‌ی آزمون‌های بسته‌پاسخ از جمله آزمون‌های چندگزینه‌ای وارد است.
  • در مقایسه با آزمون‌های صحیح- غلط، خواندن این آزمون‌ها و پیدا کردن گزینه‌ی درست مستلزم صرف وقت زیادتری است.
  • زمانی که به پاسخ‌های غلط نمره‌ی منفی داده می‌شود، دانش‌آموزانی که خطر می‌کنند، از سایر دانش‌آموزان نمره‌های بهتری می‌گیرند. هم‌چنین دانش‌آموزانی که در پاسخ دادن به این‌گونه سؤال‌ها باتجربه هستند، از دیگر دانش‌آموزان نمره‌های بهتری کسب می‌کنند.
  • دانش‌آموزان قوی بیش‌از دانش‌آموزان معمولی قادر به پیدا کردن اشکالات، پیچیدگی‌ها و نظرگاه‌های واگرا (غیرمعمولی) در سؤال‌ها هستند. اما از آن‌جا که تنها یک پاسخ صحیح در سؤال وجود دارد، بابت این تیزبینی‌های خود نه‌تنها تشویق نمی‌شوند، بلکه با دادن جوابی که مورد نظر طراح سؤال نیست، ممکن است تنبیه هم بشوند.

نمره‌گذاری و تحلیل آزمون

نمرات معیار: نمرات معیار، عملکرد هر دانش‌آموز را در یک آزمون، بنا بر اختلاف عملکرد او از میانگین گروه، برحسب واحد انحراف معیار نشان می‌دهد. آن دسته از نمرات معیار که دارای توزیعی با میانگین صفر و انحراف معیار واحد هستند، به نمرات Z شهرت دارند.

نمره‌ی T (نمره‌ی تراز): نمره‌ی T با ضرب نمرات Z در عدد ثابت a و جمع کردن نمرات حاصل با عدد ثابت b به‌دست می‌آید. بنابراین، آن دسته از نمرات معیار که دارای توزیعی با میانگین b و انحراف معیار a است، توزیع نمرات T نام دارد.
T = aZ + b
در محاسبه‌ی نمره‌ی تراز آزمون‌های مرآت، میانگین 5000 و انحراف معیار 2250 درنظر گرفته می‌شود. درنتیجه:
T = 2250Z + 5000

نمودار نرمال: پراکندگی نمرات معیار به صورت نرمال است. منحنی نرمال از لحاظ شکل، شبیه به منحنی زیر است. در این منحنی، مقایسه‌ی درصدها و نمرات معیار، در توزیعِ نرمال مشاهده می‌شود.

 

خصوصیات نمودار نرمال

  • دو قسمت منحنی نرمال نسبت به خط وسط آن قرینه هستند.
  • در توزیعی که این منحنی مُعرف آن است، اکثر نمره‌ها در وسط توزیع انباشته شده‌اند.
  • هرچه از وسط منحنی به دوطرف آن پیش برویم، از ارتفاع منحنی (حجم نمرات) کاسته می‌شود و در انتهای منحنی دنباله‌های طویلی به‌وجود می‌آیند.
  • دو امتداد منحنی در بی‌نهایت محور افقی را قطع می‌کنند، زیرا تعداد مواردی که لازم است تا یک منحنی نرمال واقعی درست شود، از لحاظ نظری بی‌نهایت است.
  • در منحنی نرمال، میانگین، میانه و نما بر روی هم قرار دارند.
  • در روی این منحنی دو نقطه وجود دارد که در آن‌ها جهت منحنی تغییر می‌کند. این دو نقطه در فواصل 1 انحراف معیار از میانگین قرار دارند.
  • در منحنی نرمال، بین انحراف معیارها و نسبت افراد یک رابطه‌ی دقیق ریاضی وجود دارد و در هر واحد انحراف معیار همیشه یک نسبت ثابت از افراد موجود است. اگر تمام سطح منحنی نرمال را برابر یک واحد فرض کنیم، 26/68% = 13/34×2 از کل سطح منحنی بین 1+ و 1- انحراف معیار واقع است. ضمناً در حدود 44/95% مساحت زیر منحنی بین 2+ و 2- انحراف معیار قرار دارد و در حدود 74/99% این مساحت نیز در فاصله‌ی 3+ و 3- انحراف معیار واقع است. بنابراین، تقریباً تمام سطح زیر منحنی نرمال در این فاصله‌ی انحراف معیار قرار دارد. به‌همین سبب است که محققان و آمارگران، سطح منحنی نرمال را عملاً بین 3+ و 3- انحراف معیار فرض می‌کنند.

تحلیل سؤال‌های آزمون

هدف از تحلیل سؤال‌های آزمون، وارسی تک تک سؤال‌ها و تعیین میزان دقت و نارسایی‌های آنهاست. در تحلیل سؤال‌های آزمون، نقاط قوت و ضعف یک آزمون و کیفیت همه‌ی سؤال‌های آن تعیین می‌شود.

برای تهیه‌ی یک آزمون خوب، علاوه بر رعایت پیشنهادهایی که پیش‌تر ارایه شد، تحلیل پاسخ‌های آزمون شوندگان و بررسی تجربی آنها ضروری است. تحلیل پاسخ‌های آزمون شوندگان، اطلاعات تشخیصی لازم را برای بررسی کیفیت یادگیری دانش‌آموزان و مشکلات آموزشی معلمان فراهم می‌آورد.

برای تحلیل سؤال‌های یک آزمون، لازم است ضرایب دشواری و تمییز هر سؤال را تعیین کرد و به تحلیل گزینه‌های انحرافی سؤال‌ها پرداخت.

ضریب دشواری: درصد کل آزمون‌شوندگانی که به یک سؤال جواب درست می‌دهند، ضریب دشواری آن سؤال است.

به‌طور کلی، ضریب‌های دشواری بین 3/0 تا 7/0 حداکثر اطلاع را درباره‌ی تفاوت بین آزمون‌شوندگان به‌دست می‌دهند.

ضریب تمییز: برخلاف ضریب دشواری که میزان آسان یا دشوار بودن یک سؤال را نشان می‌دهد، ضریب تمییز، که با d نشان داده می‌شود، قدرت سؤال را در تمایزگذاری یا تشخیص بین گروه قوی و گروه ضعیف آزمون‌شوندگان را مشخص می‌کند.

هرقدر ضریب تمییز بزرگ‌تر باشد، قوه‌ی تمییز آن سؤال بیشتر و هر قدر این ضریب کوچک‌تر باشد، قوه‌ی تمییز آن کمتر است. مثلاً اگر قوه‌ی تمییز سؤالی 90/0 باشد، آن سؤال آزمون‌شوندگان قوی و ضعیف را خیلی خوب از هم جدا خواهد کرد، اما اگر ضریب تمییز سؤالی 10/0 باشد، آن سؤال از عهده‌ی جداسازی دانش‌آموزان ضعیف و قوی به‌خوبی برنخواهد آمد. ضریب تمییز صفر حاکی از این است که آن سؤال به‌هیچ وجه نتوانسته بین گروه قوی و ضعیف تمایز قائل شود.