Негосударственное общеобразовательное учреждение Средняя общеобразовательная школа

Валидность методики: Валидность методики

Содержание

Валидность методики

8.11.2012

Валидность методики — соответствие того, что на самом деле изучает (оценивает, измеряет, характеризует) данная методика, тому, для изучения (оценки, измерения, характеристики) чего она предназначена. Если, например, некоторый психологический тест или психодиагностическая методика, основанная на сознательном самоотчете , предназначена для изучения какой-либо черты личности (см.) человека — такой черты, которая не может быть осознана или правильно сознательно оценена самим человеком, то соответствующая методика не будет валидной. На самом деле ответы испытуемого на вопросы, касающиеся наличия, отсутствия или степени развитости у него этой черты личности, могут выражать лишь то, как он воспринимает и оценивает себя, или то, каким ему хотелось бы выглядеть в глазах окружающих людей. В. одно из главных требований, предъявляемых к психологическим тестам и к другим методам изучения психических явлений.

Существуют множество разновидностей валидности, выделяемых и рассматриваемых тогда, когда сама валидность выступает как предмет специального теоретического исследования:

  • априорная,
  • сопутствующая,
  • конгруэнтная,
  • консенсусная,
  • конструктивная,
  • критериальная,
  • содержательная,
  • по определению,
  • дифференциальная,
  • эмпирическая,
  • факториальная,
  • внутренняя,
  • внешняя,
  • теоретическая и ряд других.

До сих пор, однако, не существует единого мнения ни по вопросу о том, как называть разные виды валидности, ни по вопросу о том, каким видам валидности методика обязательно должна соответствовать. Вместе с тем, если психодиагностическая методика является теоретически или практически невалидной, внутренне или внешне невалидной, то ею не рекомендуется пользоваться, по крайней мере в научных исследованиях.

Ключевые слова: Методики

Источник: Немов Р. С., Психология. В 2 частях

Материалы по теме

Тест оценки коммуникативных умений собеседника

Долгова В. И., Мельник Е. В. Эмпатия и коммуникативная компетентность. Челябинск, 2007.

Шкала семейного окружения (ШСО)

Шапарь В.Б., Практическая психология. Психодиагностика отношений между родителями и детьми…

Определение преобладающего типа темперамента (Белов А.)

Методы изучения взаимоотношений

Социальная психология развития личности / Я. Л. Коломинский, С. Н. Жеребцов. — Минск : Выш….

Исследование нарушений произвольных действий в нейропсихологии

Нейропсихология: учебник для вузов / М.Е. Баулина. — М.: Издательство ВЛАДОС, 2018. — 391 с…

Методы оценки одаренности творческой личности

Е. П. Ильин. «Психология творчества, креативности, одаренности» Питер; СПб.; 2009

Клинический метод диагностики психического расстройства

Справочник по психиатрии / Н.М. Жариков, Д.Ф. Хритинин, М.А. Лебедев. — М.: ООО «…

Диагностика личностных расстройств с помощью многофакторного опросника MMPI («мини-мульт»)

Шапарь В.Б., Практическая психология. Психодиагностика отношений между родителями и детьми…

www.Psyarticles.ru — учебные статьи по психологии

Учебные материалы по психологии и психологические статьи — основное содержание сайта.

Проект в значительной степени рассчитан на самообразование читателей, ранее систематически не изучавших психологию, однако может оказаться полезным и для специалистов, расширяющих свой профессиональный кругозор.

Материалы сайта представляют собой наиболее важные и интересные фрагменты из учебных пособий и научных работ из самых разнообразных отраслей психологии.

Проект будет полезен психологам и врачам, студентам и преподавателям, специалистам в области управления, а также широкому кругу читателей, интересующихся вопросами современной психологии.

Предпосылки возникновения конфликта в процессе общения

Рассмотрим особенности поведения человека в конфликтной ситуации прежде всего в процессе общения. В процессе человеческих взаимоотношений, как вы уже знаете из предыдущих разделов, процесс общения предполагает наличие следующих трех факторов: восприятия, эмоций и обмена информацией. В конфликтных ситуациях легко забыть об этом. Поэтому кратко рассмотрим, что же может создавать почву для их возникновения.

Социально-психологические предпосылки. Первая трудность — это разногласия из-за несовпадения ваших рассуждении с рассуждениями другой стороны. Ведь то, какой вы видите проблему, зависит от того, с какой колокольни, образно говоря, смотрите на нее.

Специфика конфликтов в образовательных процессах

В культурно-историческом подходе Л.С. Выготского процессы образования рассматриваются, с одной стороны, как предназначенные для разрешения противоречий развития общества, с другой — как обладающие внутренне противоречивым характером.

Мы придерживаемся именно этого подхода, и вслед за Л.С. Выготским и его последователями исходим из того, что конфликт представляет собой механизм развития человеческой деятельности и соответственно личности.

Современная психология: ее задачи и место в системе наук

В последние годы наблюдается бурное развитие психологической науки, обусловленное многообразием теоретических и практических задач, встающих перед нею. В нашей стране интерес к психологии особенно показателен — ей наконец-то начинают уделять то внимание, которого она заслуживает, причем практически во всех отраслях современного образования и бизнеса.

Основной задачей психологии является изучение законов психической деятельности в ее развитии. В течение последних десятилетий значительно расширились диапазон и направления психологических исследований, появились новые научные дисциплины.

Методы психологии

Методы научных исследований — это те приемы и средства, с помощью которых ученые получают достоверные сведения, используемые далее для построения научных теорий и выработки практических рекомендаций.

Сила науки во многом зависит от совершенства методов исследования, от того насколько они валидны и надежны, как быстро и эффективно данная отрасль знаний способна воспринять и использовать у себя все самое новое, передовое, что появляется в методах других наук.

Алгоритм оценки достоверности информации в результате психофизиологического исследования с применением полиграфа

Двадцать лет назад использование прибора способного отличить ложь от правды – «детектора лжи» было исключительной прерогативой спецслужб ведущих мировых держав. За прошедшие годы ситуация кардинально изменилась.

Проверки на «детекторе», стали доступными для широкого круга потребителей – правоохранительных органов, руководителей коммерческих и банковских структур, представителей кадровых служб, частных охранных предприятий и просто граждан, желающих получить достоверную информацию.

Процесс формирования двигательного навыка. Принцип активности и его развитие Н.А. Бернштейном

Переходим к следующей важной теме, совершенно по-новому раскрытой Н. А. Бернштейном, — механизмам формирования навыка. Эта проблема очень важна для психологии, так как формирование навыков составляет, как вы уже знаете, основу всякого обучения.

Процесс формирования навыка описан у Бернштейна очень подробно. Он выделил много частных фаз — порядка семи, которые объединяются в более общие периоды. Для первого знакомства достаточно будет разобрать эти периоды.

Проблема психодинамического диагноза

Психодинамическая диагностика, в отличие от дискретно-описательного диагностического подхода, укоренившегося в отечественных медицинской и психологической традициях, представляет собой прежде всего диагностику структуры личности с точки зрения ее развития.

Подобный подход, обеспечивающий целостный и всесторонний анализ личности и ее психопатологии, определяет и специфику терапевтических методов.

Психологическая профилактика конфликтов в коллективе

Многие организационные конфликты легче предупредить, чем разрешить.

Поскольку центральными фигурами конфликтов в организации являются конкретные личности, то такая профилактика должна быть личностно-ориентированной.

Остановимся на некоторых особо значимых организационно-управленческих условиях, способствующих снижению конфликтности личности.

Четыре элемента процесса убеждения

Процесс убеждения складывается из следующих элементов: агент влияния (источник сообщения), само сообщение, условия, в которых передается сообщение (контекст), и реципиент, то есть тот индивид, которому предназначено сообщение.

Само сообщение, в зависимости от его содержания, от того, как оно сформулировано и в какой форме преподнесено, также может либо убеждать, либо внушать. Но может и не иметь вообще никакого эффекта.

Повышение уровня сознания. Насколько это важно?

Тема самосовершенствования и развития человеческих качеств, можно сказать, вечная, при этом мудрые люди часто повторяют, что самой важной задачей для каждого человека является развитие его собственного сознания.

Несмотря на очевидную важность темы, серьезных и качественных материалов, посвященных этому вопросу, не так уж и много, хотя периодически все же появляются интересные работы.

Надежность и достоверность исследований

Опубликован в 3 июля 2019 г. к Фиона Миддлтон. Отредактировано 19 декабря 2022 г.

Надежность и достоверность — понятия, используемые для оценки качества исследований. Они указывают, насколько хорошо тот или иной метод, прием. или тест измеряет что-то. Надежность связана с непротиворечивостью меры, а валидность связана с точностью меры.

Важно учитывать надежность и достоверность при разработке плана исследования, планировании методов и оформлении результатов, особенно в количественных исследованиях. Невыполнение этого требования может привести к нескольким типам предвзятости в исследованиях и серьезно повлиять на вашу работу.

Надежность и достоверность
Надежность Срок действия
Что это вам говорит? Степень, в которой результаты могут быть воспроизведены при повторении исследования в тех же условиях. Степень, в которой результаты действительно измеряют то, что они должны измерять.
Как оценивается? Путем проверки согласованности результатов во времени, у разных наблюдателей и в разных частях самого теста. Путем проверки того, насколько хорошо результаты соответствуют установленным теориям и другим показателям той же концепции.
Как они связаны? Надежное измерение не всегда достоверно: результаты могут быть воспроизводимыми, но не обязательно правильными. Действительное измерение, как правило, надежно: если тест дает точные результаты, они должны быть воспроизводимыми.

Содержание

  1. Сравнение надежности и валидности
  2. Как оцениваются надежность и валидность?
  3. Как обеспечить достоверность и достоверность вашего исследования
  4. Где написать о достоверности и достоверности в диссертации

Сравнение надежности и достоверности

Надежность и валидность тесно связаны, но означают разные вещи. Измерение может быть надежным, но не валидным. Однако, если измерение достоверно, оно обычно также надежно.

Что такое надежность?

Надежность относится к тому, насколько последовательно метод что-то измеряет. Если один и тот же результат может быть последовательно достигнут с использованием одних и тех же методов при одних и тех же обстоятельствах, измерение считается надежным.

Вы измеряете температуру жидкого образца несколько раз в одинаковых условиях. Термометр каждый раз показывает одну и ту же температуру, поэтому результаты надежны.

Врач использует вопросник симптомов для диагностики пациента с хроническим заболеванием. Несколько разных врачей используют один и тот же опросник у одного и того же пациента, но ставят разные диагнозы. Это указывает на низкую надежность опросника как меры состояния.

Что такое валидность?

Валидность относится к тому, насколько точно метод измеряет то, для измерения которого он предназначен. Если исследование имеет высокую достоверность, это означает, что оно дает результаты, соответствующие реальным свойствам, характеристикам и изменениям в физическом или социальном мире.

Высокая надежность является одним из показателей достоверности измерения. Если метод ненадежен, он, вероятно, недействителен.

Если термометр каждый раз показывает разные температуры, даже если вы тщательно контролируете условия, чтобы гарантировать, что температура образца остается неизменной, вероятно, термометр неисправен, и поэтому его измерения недействительны.

Если опросник по симптомам дает надежный диагноз при ответах на него в разное время и у разных врачей, это указывает на то, что он имеет высокую достоверность в качестве измерения состояния здоровья.

Однако одной надежности недостаточно для обеспечения достоверности. Даже если тест надежен, он может не точно отражать реальную ситуацию.

Термометр, который вы использовали для проверки образца, дает надежные результаты. Однако термометр не был откалиброван должным образом, поэтому результат на 2 градуса ниже истинного значения. Следовательно, измерение недействительно.

Группа участников проходит тест, предназначенный для измерения рабочей памяти. Результаты надежны, но оценки участников сильно коррелируют с их уровнем понимания прочитанного. Это указывает на то, что метод может иметь низкую достоверность: тест может измерять понимание прочитанного участниками, а не их рабочую память.

Валидность оценить труднее, чем надежность, но это даже важнее. Чтобы получить полезные результаты, методы, которые вы используете для сбора данных, должны быть достоверными: исследование должно измерять то, что заявлено для измерения. Это гарантирует, что ваше обсуждение данных и выводы, которые вы делаете, также верны.

Как оцениваются надежность и валидность?

Надежность можно оценить путем сравнения различных вариантов одного и того же измерения. Достоверность оценить труднее, но ее можно оценить, сравнив результаты с другими соответствующими данными или теорией. Методы оценки надежности и валидности обычно делятся на разные типы.

Типы надежности

Различные виды надежности можно оценить с помощью различных статистических методов.

Виды надежности
Тип надежности Что он оценивает? Пример
Ретестовая надежность Непротиворечивость меры во времени : вы получаете те же результаты при повторении измерения? Группа участников заполняет анкету, предназначенную для измерения личностных качеств. Если они повторяют опросник с интервалом в несколько дней, недель или месяцев и дают одинаковые ответы, это свидетельствует о высокой ретестовой достоверности.
Межоценочная надежность Согласованность измерения между оценщиками или наблюдателями : получаются ли одинаковые результаты, когда разные люди проводят одно и то же измерение? На основе контрольного списка критериев оценки пять экзаменаторов представили существенно разные результаты для одного и того же студенческого проекта.
Это указывает на то, что контрольный список оценивания имеет низкую межэкспертную надежность (например, из-за того, что критерии слишком субъективны).
Внутренняя согласованность Непротиворечивость самого измерения : получаете ли вы одинаковые результаты из разных частей теста, предназначенных для измерения одного и того же? Вы разрабатываете анкету для измерения самооценки. Если вы случайным образом разделите результаты на две половины, между двумя наборами результатов должна быть сильная корреляция. Если два результата сильно различаются, это указывает на низкую внутреннюю согласованность.

Типы действия

Достоверность измерения можно оценить на основе трех основных типов доказательств. Каждый тип может быть оценен с помощью экспертной оценки или статистических методов.

Типы действия
Тип действия Что он оценивает? Пример
Действительность конструкции Приверженность меры существующей теории и знаниям  измеряемой концепции. Анкета самооценки может быть оценена путем измерения других черт, известных или предполагаемых, связанных с концепцией самооценки (таких как социальные навыки и оптимизм). Сильная корреляция между оценками самооценки и связанными с ней чертами указывает на высокую достоверность конструкции.
Действительность содержимого Степень, в которой измерение охватывает все аспекты измеряемой концепции. Тест, целью которого является оценка уровня испанского языка учащихся класса, содержит компоненты чтения, письма и разговорной речи, но не включает компонент аудирования. Эксперты сходятся во мнении, что понимание на слух является важным аспектом языковых способностей, поэтому тесту не хватает достоверности содержания для измерения общего уровня владения испанским языком.
Критерий достоверности Степень, в которой результат меры соответствует другим действительным мерам той же концепции. Опрос проводится для измерения политических взглядов избирателей в регионе. Если результаты точно предсказывают более поздний исход выборов в этом регионе, это указывает на то, что опрос имеет высокую достоверность критерия.

Для оценки достоверности причинно-следственной связи необходимо также учитывать внутреннюю валидность (дизайн эксперимента) и внешнюю валидность (обобщаемость результатов).

Как обеспечить достоверность и надежность ваших исследований

Надежность и валидность ваших результатов зависят от тщательной разработки плана исследования, выбора подходящих методов и образцов, а также тщательного и последовательного проведения исследования.

Обеспечение достоверности

Если вы используете баллы или рейтинги для измерения различий в чем-то (например, психологических чертах, уровнях способностей или физических свойствах), важно, чтобы ваши результаты максимально точно отражали реальные различия. Валидность следует учитывать на самых ранних этапах вашего исследования, когда вы решаете, как вы будете собирать свои данные.

  • Выберите подходящие методы измерения

Убедитесь, что ваш метод и методика измерения имеют высокое качество и предназначены для измерения именно того, что вы хотите знать. Они должны быть тщательно исследованы и основаны на имеющихся знаниях.

Например, для сбора данных о черте характера можно использовать стандартизированный вопросник, который считается надежным и достоверным. Если вы разрабатываете свою собственную анкету, она должна основываться на устоявшейся теории или результатах предыдущих исследований, а вопросы должны быть тщательно и точно сформулированы.

  • Используйте соответствующие методы выборки для выбора объектов исследования

Чтобы получить достоверные и обобщаемые результаты, четко определите изучаемую группу населения (например, люди определенного возраста, географического положения или профессии). Убедитесь, что у вас достаточно участников и что они представляют население. Невыполнение этого требования может привести к систематической ошибке выборки и систематической ошибке отбора.

Обеспечение надежности

Надежность следует учитывать на протяжении всего процесса сбора данных. Когда вы используете инструмент или метод для сбора данных, важно, чтобы результаты были точными, стабильными и воспроизводимыми.

  • Последовательно применяйте свои методы

Тщательно спланируйте свой метод, чтобы убедиться, что вы выполняете одни и те же шаги одинаковым образом для каждого измерения. Это особенно важно, если в работе участвуют несколько исследователей.

Например, если вы проводите интервью или наблюдения, четко определите, как будут учитываться конкретные действия или ответы, и убедитесь, что вопросы формулируются одинаково каждый раз. Невыполнение этого требования может привести к таким ошибкам, как смещение переменной или информации.

  • Стандартизируйте условия вашего исследования

При сборе данных старайтесь, чтобы обстоятельства были как можно более последовательными, чтобы уменьшить влияние внешних факторов, которые могут привести к изменению результатов.

Например, в экспериментальной установке убедитесь, что всем участникам предоставляется одинаковая информация и они тестируются в одинаковых условиях, желательно в должным образом рандомизированных условиях. Невыполнение этого требования может привести к эффекту плацебо, эффекту Хоторна или другим характеристикам спроса. Если участники могут угадать цели или задачи исследования, они могут попытаться действовать более социально желательными способами.

Где написать о достоверности и валидности в диссертации

Уместно обсуждать надежность и валидность в различных разделах вашей диссертации, диссертации или исследовательской работы. Демонстрация того, что вы приняли их во внимание при планировании своего исследования и интерпретации результатов, делает вашу работу более достоверной и заслуживающей доверия.

Достоверность и обоснованность диссертации
Секция Обсудить
Обзор литературы Что сделали другие исследователи для разработки и улучшения надежных и действенных методов?
Методология Как вы планировали свое исследование, чтобы обеспечить надежность и достоверность используемых мер? Это включает в себя выбранный набор и размер образца, подготовку образца, внешние условия и методы измерения.
Результаты Если вы рассчитываете надежность и достоверность, укажите эти значения вместе с вашими основными результатами.
Обсуждение Сейчас самое время поговорить о том, насколько надежными и достоверными были ваши результаты. Были ли они последовательными и отражали ли они истинные ценности? Если нет, то почему?
Заключение Если надежность и валидность были большой проблемой для ваших выводов, было бы полезно упомянуть об этом здесь.

 

Процитировать эту статью Scribbr

Если вы хотите процитировать этот источник, вы можете скопировать и вставить цитату или нажать кнопку «Цитировать эту статью Scribbr», чтобы автоматически добавить цитату в наш бесплатный генератор цитирования.

Миддлтон, Ф. (2022, 19 декабря). Надежность и валидность в исследованиях | Отличие, типы и примеры. Скриббр. Проверено 3 января 2023 г., с https://www.scribbr.com/methodology/reliability-vs-validity/

Процитировать эту статью

Полезна ли эта статья?

Вы уже проголосовали. Спасибо 🙂 Ваш голос сохранен 🙂 Обработка вашего голоса. ..

Фиона редактирует Scribbr с августа 2016 года. Она имеет степень бакалавра геологии и в настоящее время работает над получением степени магистра морских наук. Ей нравится работать со студентами по всему миру, чтобы улучшить их письмо.

4 типа достоверности исследований

Опубликован в 6 сентября 2019 г. к Фиона Миддлтон. Отредактировано 30 ноября 2022 г.

Валидность говорит вам, насколько точно метод что-то измеряет. Если метод измеряет то, что заявлено для измерения, и результаты точно соответствуют реальным значениям, то его можно считать действительным. Существует четыре основных типа валидности:

  • Конструктивная валидность : Измеряет ли тест концепцию, для измерения которой он предназначен?
  • Валидность содержания : Является ли тест полностью репрезентативным для измерения?
  • Внешняя достоверность : Соответствует ли содержание теста его целям?
  • Критерий достоверности : Точно ли результаты измеряют конкретный результат, для измерения которого они предназначены?

В количественных исследованиях вы должны учитывать надежность и достоверность ваших методов и измерений.

Обратите внимание, что в этой статье рассматриваются типы проверки достоверности, которые определяют точность фактических компонентов показателя. Если вы проводите экспериментальное исследование, вам также необходимо учитывать внутреннюю и внешнюю валидность, которые касаются плана эксперимента и возможности обобщения результатов.

Содержание

  1. Конструктивная валидность
  2. Контентная валидность
  3. Лицевая валидность
  4. Критериальная валидность
  5. Часто задаваемые вопросы о типах валидности

Действительность конструкции

Конструктивная валидность оценивает, действительно ли инструмент измерения представляет то, что мы хотим измерить. Это важно для установления общей валидности метода.

Что такое конструкция?

Конструкт относится к понятию или характеристике, которые нельзя наблюдать напрямую, но которые можно измерить, наблюдая за другими связанными с ними индикаторами.

Конструкты могут быть характеристиками людей, такими как интеллект, ожирение, удовлетворенность работой или депрессия; они также могут быть более широкими понятиями, применяемыми к организациям или социальным группам, таким как гендерное равенство, корпоративная социальная ответственность или свобода слова.

Пример

Не существует объективной наблюдаемой сущности под названием «депрессия», которую мы могли бы измерить напрямую. Но, основываясь на существующих психологических исследованиях и теориях, мы можем измерить депрессию на основе набора симптомов и индикаторов, таких как низкая уверенность в себе и низкий уровень энергии.

Что такое допустимость конструкции?

Валидность конструкции заключается в том, чтобы убедиться, что метод измерения соответствует конструкции, которую вы хотите измерить. Если вы разрабатываете анкету для диагностики депрессии, вам нужно знать: действительно ли анкета измеряет конструкт депрессии? Или на самом деле он измеряет настроение респондента, его самооценку или какую-то другую конструкцию?

Чтобы достичь конструктивной достоверности, вы должны убедиться, что ваши индикаторы и измерения тщательно разработаны на основе соответствующих существующих знаний. Анкета должна включать только соответствующие вопросы, которые измеряют известные показатели депрессии.

Все другие типы валидности, описанные ниже, можно рассматривать как формы доказательства конструктной валидности.

Действительность содержимого

Валидность содержания оценивает, является ли тест репрезентативным для всех аспектов конструкции.

Для получения достоверных результатов содержание теста, обследования или метода измерения должно охватывать все соответствующие части предмета, для измерения которого он предназначен. Если некоторые аспекты отсутствуют в измерении (или если включены нерелевантные аспекты), достоверность ставится под угрозу, и исследование, вероятно, страдает от систематической ошибки, связанной с пропущенной переменной.

Пример

Учительница математики разрабатывает тест по алгебре в конце семестра для своего класса. Тест должен охватывать все формы алгебры, которые преподавались в классе. Если некоторые виды алгебры будут опущены, то результаты могут не быть точным показателем понимания учащимися предмета. Точно так же, если она включает вопросы, не связанные с алгеброй, результаты перестают быть действительным показателем знаний по алгебре.

Что может сделать корректура для вашей статьи?

Редакторы Scribbr не только исправляют грамматические и орфографические ошибки, но и улучшают качество письма, следя за тем, чтобы в статье не было неясных формулировок, избыточных слов и неудобных формулировок.

См. пример редактирования

Проверка лица

Внешняя валидность показывает, насколько подходящим выглядит содержание теста на первый взгляд. Это похоже на содержательную валидность, но внешняя валидность — более неформальная и субъективная оценка.

Пример

Вы создаете опрос для измерения регулярности пищевых привычек людей. Вы просматриваете элементы опроса, в которых задаются вопросы о каждом приеме пищи в течение дня и перекусах между ними в течение каждого дня недели. На первый взгляд опрос кажется хорошим представлением того, что вы хотите протестировать, поэтому вы считаете, что он имеет высокую юридическую достоверность.

Поскольку внешняя достоверность является субъективной мерой, ее часто считают самой слабой формой достоверности. Однако он может быть полезен на начальных этапах разработки метода.

Справедливость критерия

Валидность критерия оценивает, насколько хорошо тест может предсказать конкретный результат или насколько хорошо результаты вашего теста приближаются к результатам другого теста.

Что такое переменная критерия?

Критериальная переменная — это устоявшаяся и эффективная мера, которая широко считается достоверной, иногда называемая «золотым стандартом». Критериальные переменные может быть очень трудно найти.

Что такое достоверность критерия?

Чтобы оценить достоверность критерия, вы вычисляете корреляцию между результатами вашего измерения и результатами измерения критерия. Если есть высокая корреляция, это дает хороший признак того, что ваш тест измеряет то, что он намеревается измерить.

Пример

Профессор университета создает новый тест для оценки навыков письма абитуриентов на английском языке. Чтобы оценить, насколько хорошо тест действительно измеряет навыки письма учащихся, она находит существующий тест, который считается достоверным измерением навыков письма на английском языке, и сравнивает результаты, когда одна и та же группа учащихся проходит оба теста. Если результаты очень похожи, новый тест имеет высокую достоверность критерия.

Часто задаваемые вопросы о типах достоверности

В чем сходство содержания и внешней достоверности?

Лицевая валидность и валидность содержания похожи в том, что они оба оценивают, насколько подходит содержание теста. Разница в том, что лицевая достоверность субъективна и оценивает содержание на поверхностном уровне.

Когда тест имеет сильную внешнюю валидность, любой согласится с тем, что вопросы теста кажутся измеряющими то, для чего они предназначены.

Например, глядя на тест по математике для 4-го класса, состоящий из задач, в которых учащиеся должны складывать и умножать, большинство людей согласятся, что он имеет сильную юридическую достоверность (т. е. он выглядит как тест по математике).

С другой стороны, достоверность содержания оценивает, насколько хорошо тест представляет все аспекты темы. Оценка валидности содержания более систематична и опирается на экспертную оценку. каждого вопроса, анализируя, охватывает ли каждый из них те аспекты, для которых был разработан тест.

Тест по математике для 4-го класса будет иметь высокую содержательную достоверность , если он охватывает все навыки, преподаваемые в этом классе. Эксперты (в данном случае учителя математики) должны будут оценить достоверность содержания, сравнив тест с целями обучения.

Какие существуют два типа критерия валидности?

Валидность критерия оценивает, насколько хорошо тест измеряет результат, для измерения которого он был разработан. Исходом может быть, например, начало заболевания.

Валидность критерия состоит из двух подтипов в зависимости от времени получения двух показателей (критерия и вашего теста):

  • Параллельная валидность — это стратегия проверки, при которой получаются баллы теста и критерия в тот же раз .
  • Прогностическая валидность — это стратегия проверки, в которой переменные критерия измеряются после баллов теста.
Почему конвергентную и дискриминантную валидность часто оценивают вместе?
org/Answer»>

Конвергентная валидность и Дискриминантная валидность — оба подтипа конструктной валидности. Вместе они помогают оценить, измеряет ли тест концепцию, для измерения которой он был разработан.

  • Конвергентная валидность показывает, коррелирует ли тест, предназначенный для измерения конкретной конструкции, с другими тестами, оценивающими ту же или аналогичную конструкцию.
  • Дискриминантная валидность показывает, действительно ли два теста, которые должны , а не быть тесно связаны друг с другом, не связаны друг с другом. Этот тип валидности также называется расходящаяся действительность .

Вам необходимо оценить оба, чтобы продемонстрировать достоверность конструкции. Ни одного из них в отдельности недостаточно для установления валидности конструкции.

Почему экологическая валидность не ставится в приоритет в исследованиях, проводимых в режиме проверки теории?
org/Answer»>

Целью режима проверки теории является поиск доказательств для опровержения, уточнения или поддержки теории. Таким образом, возможность обобщения не является целью режима проверки теории.

В связи с этим приоритетом исследователей в режиме проверки теории является устранение альтернативных причин взаимосвязей между переменными. Другими словами, они отдают приоритет внутренней валидности внешней валидности, включая экологическую валидность.

Кто должен оценивать лицевую валидность?

Часто лучше попросить нескольких людей проверить ваши измерения. Вы можете попросить экспертов, таких как другие исследователи, или неспециалистов, таких как потенциальные участники, оценить внешнюю достоверность тестов.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *