Содержание

Физическим лицам – нормативы потребления электроэнергии

Нормативы потребления электроэнергии населением

Постановлением Региональной энергетической комиссии Кемеровской области №1107 от 30 декабря 2014г. О внесении изменений в постановление региональной энергетической комиссии Кемеровской области от 31.10.2006 № 141 «О нормативах потребления коммунальных услуг по электроснабжению на территории Кемеровской области»

Норматив потребления коммунальной услуги по электроснабжению в жилых помещениях, кВтч в месяц на 1 человека:

Категория населения

Количество человек, проживающих в квартире

1 чел.

2 чел.

3 чел.

4 чел.

5 чел.

6 чел.

и более

1. Население, проживающее в домах, оборудованных газовыми плитами или печным отоплением

100

80

80

70

64

60

2. Население, проживающее в домах, оборудованных в установленном порядке стационарными электроплитами

130 100 100 87,5 80 75

Применение норматива осуществляется в соответствии с пунктом 8 (1) Приложения к Правилам установления и определения нормативов потребления коммунальных услуг, утвержденным Постановлением Правительства РФ от 23. 05.2006 № 306, устанавливающим, что при наличии технической возможности установки коллективных (общедомовых), индивидуальных или общих (квартирных) приборов учета и в случае их не установки норматив потребления коммунальной услуги по электроснабжению в жилых помещениях определяется с учетом повышающего коэффициента

, составляющего:

с 1 января 2015 г. по 30 июня 2015 г. 1,1
с 1 июля 2015 г. по 31 декабря 2015 г. 1,2
с 1 января 2016 г. по 30 июня 2016 г. 1,4
с 1 июля 2016 г. по 31 декабря 2016 г. 1,5
с 2017 года 1,6

ПОСТАНОВЛЕНИЕ от 31 октября 2006 г. N 141 “О НОРМАТИВАХ ПОТРЕБЛЕНИЯ КОММУНАЛЬНЫХ УСЛУГ ПО ЭЛЕКТРОСНАБЖЕНИЮ НА ТЕРРИТОРИИ КЕМЕРОВСКОЙ ОБЛАСТИ” (Скачать).

ПОСТАНОВЛЕНИЕ региональной энергетической комиссии Кемеровской области от 30.12.2014г. №1107 «О внесении изменений в постановление региональной энергетической комиссии Кемеровской области от 31.10.2006 № 141 «О нормативах потребления коммунальных услуг по электроснабжению на территории Кемеровской области»” (Скачать).

Приложение к постановлению региональной энергетической комиссии Кемеровской области от 30 декабря 2014г. №1107 (Скачать)

Места общего пользования (расчеты) – NM-ENERGY.RU

 

 С 1 сентября 2012г. в соответствии с ПП РФ №354 «О предоставлении коммунальных услуг собственникам и пользователям помещений в  многоквартирных домах» изменился порядок расчетов за электроэнергию, потребленную  в местах общего пользования. Норматив потребления электроэнергии на общедомовые нужды будет установлен на  квадратный метр площади мест общего пользования. В случае отсутствия общедомового прибора учета электроэнергии, площадь мест общего пользования умножается на норматив. Получившийся результат делится на всех пропорционально площади квартир. Больше заплатит тот, чья квартира больше.

 В домах, оборудованных общедомовыми и индивидуальными приборами учета электроэнергии вместо норматива берется разница объемов электроэнергии за расчетный период по общедомовому прибору учета и суммы потребления электроэнергии по квартирам, и делится пропорционально площади квартир.

 При наличии общедомового прибора учета (ОДПУ) электроэнергии расчет проводится по следующей формуле:

(Vодпу – ΣVпу) х Si/Sобщ. х Т , где

Vодпу – объем потребленной электроэнергии за расчетный период, определенный по показаниям общедомового прибора учета в МКД
ΣVпу – сумма потребления электроэнергии по квартирам в МКД
Si – общая площадь i-жилого помещения в МКД
Sобщ. – общая площадь МКД
Т – тариф

 При отсутствии ОДПУ электроэнергии  применяется следующий расчет:

N х Sои х Si/Sобщ х Т, где

N – норматив потребления коммунальной услуги (норматив утвержден Постановлением Администрации НАО № 234-п от 17.

08.12г.)
Sои – площадь общего имущества в МКД
Si – общая площадь i-жилого помещения в МКД
Sобщ. – общая площадь МКД
Т – тариф

 Убедительно просим абонентов сообщать показания приборов учета до 25 числа следующего месяца. Просим также сообщать о случаях несанкционированного  подключения к электросетям  по  тел. 4-97-93.

 Помните, что за “энерго-вора” придется платить соседям!

Нормативы потребления

Категория многоквартирных домов

Единица измерения

Норматив

1.

Многоквартирные дома, не оборудованные лифтами и электроотопительными и электронагревательными установками для целей горячего водоснабжения

1. 1.

Многоквартирные дома, не оборудованные лифтами и электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 1,45 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

кВт ч в месяц на кв. метр

0,59

1.2.

Многоквартирные дома, не оборудованные лифтами и электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 2,2 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

0,84

1. 3.

Многоквартирные дома, не оборудованные лифтами и электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 2,5 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

1,53

1.4.

Многоквартирные дома, не оборудованные лифтами и электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 3,5 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

1,82

1.5.

Многоквартирные дома, не оборудованные лифтами и электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 4,6 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

2,12

1.6

Многоквартирные дома, не оборудованные лифтами и электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 6,8 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений и выше

3,21

2.

Многоквартирные дома, оборудованные лифтами и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения

2.1.

Многоквартирные дома, оборудованные лифтами и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 1,45 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

кВт ч в месяц на кв. метр

2.2.

Многоквартирные дома, оборудованные лифтами и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 2,2 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

2.3.

Многоквартирные дома, оборудованные лифтами и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 2,5 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

2.4.

Многоквартирные дома, оборудованные лифтами и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 3,5 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

2,44

2.5.

Многоквартирные дома, оборудованные лифтами и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 4,6 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

2,74

2.6

Многоквартирные дома, оборудованные лифтами и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 6,8 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений и выше

3,88

3.

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, в отопительный период

3. 1.

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, в отопительный период, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 1,45 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

кВт ч в месяц на кв.метр

0,59

3.2.

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, в отопительный период, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 2,2 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

0,84

3. 3.

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, в отопительный период, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 2,5 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

1,53

3.4.

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, в отопительный период, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 3,5 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

1,82

3. 5.

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, в отопительный период, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 4,6 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

2,12

3.6

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, в отопительный период, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 6,8 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений и выше

3,21

4.

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, вне отопительного периода

4.1.

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, вне отопительного периода, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 1,45 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

кВт ч в месяц на кв. метр

0,59

4.2.

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, вне отопительного периода, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 2,2 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

0,84

4.3.

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, вне отопительного периода, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 2,5 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

1,53

4.4.

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, вне отопительного периода, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 3,5 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

1,82

4.5.

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, вне отопительного периода, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 4,6 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

2,12

4.6

Многоквартирные дома, не оборудованные лифтами и оборудованные электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, вне отопительного периода, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 6,8 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений и выше

3,21

5.

Многоквартирные дома, оборудованные лифтами, насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения

5.1.

Многоквартирные дома, оборудованные лифтами, насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 1,45 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

кВт ч в месяц на кв. метр

5.2.

Многоквартирные дома, оборудованные лифтами, насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 2,2 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

5.3.

Многоквартирные дома, оборудованные лифтами, насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 2,5 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

5.4.

Многоквартирные дома, оборудованные лифтами, насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 3,5 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

2,72

5.5.

Многоквартирные дома, оборудованные лифтами, насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 4,6 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

3,03

5.6

Многоквартирные дома, оборудованные лифтами, насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные электроотопительными и электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 6,8 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений и выше

4,22

6.

Многоквартирные дома, оборудованы насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные лифтами и электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения

6. 1.

Многоквартирные дома, оборудованы насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные лифтами и электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 1,45 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

кВт ч в месяц на кв. метр

6.2.

Многоквартирные дома, оборудованы насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные лифтами и электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 2,2 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

0,97

6.3.

Многоквартирные дома, оборудованы насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные лифтами и электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 2,5 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

1,83

6.4.

Многоквартирные дома, оборудованы насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные лифтами и электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 3,5 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

2,1

6.5.

Многоквартирные дома, оборудованы насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные лифтами и электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 4,6 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений

2,41

6.6.

Многоквартирные дома, оборудованы насосным оборудованием холодного, горячего водоснабжения, отопления и не оборудованные лифтами и электроотопительными и (или) электронагревательными установками для целей горячего водоснабжения, имеющие в составе общего имущества осветительные установки с удельной нормой расхода электроэнергии 6,8 тыс. кВт ч/год на 1000 кв.м общей площади жилых помещений и выше

3,56

В Алтайском крае утверждены нормативы потребления коммунальной услуги по электроснабжению

16.11.2018

16 ноября на очередном заседании правления управления по тарифам были приняты решения №188 «Об утверждении нормативов потребления коммунальной услуги по электроснабжению в жилых помещениях на территории Алтайского края» и №189 «Об утверждении нормативов потребления электрической энергии в целях содержания общего имущества в многоквартирном доме и нормативов потребления коммунальной услуги по электроснабжению при использовании надворных построек, расположенных на земельном участке, на территории Алтайского края». Указанные решения вступают в силу с момента опубликования на официальном сайте правовой информации pravo.gov.ru.

Новые нормативы потребления коммунальной услуги по электроснабжению установлены в связи необходимостью приведения действовавших ранее нормативов в соответствие с Постановлением Правительства Российской Федерации от 23. 05.2006 № 306 «Об утверждении Правил установления и определения нормативов потребления коммунальных услуг», а также с учетом позиции органов прокуратуры Алтайского края.

Нормативы были рассчитаны на основании данных, представленных управляющими компаниями, гарантирующими поставщиками электрической энергии Алтайского края, органами местного самоуправления. Итоги обработки исходных данных позволили произвести расчеты нормативов потребления коммунальной услуги по электроснабжению в жилых помещениях многоквартирных домов и жилых домах, в том числе общежитиях квартирного типа на территории Алтайского края, методом аналогов, а для общежитий коридорного, гостиничного и секционного типов – расчетным методом.

Нормативы потребления электрической энергии в целях содержания общего имущества в многоквартирном доме определены в соответствии с действующим законодательством расчетным методом.

Предложенный перечень нормативов, утвержденный решениями управления по тарифам от 16. 11.2018 №188,189, полностью соответствует Постановлению Правительства Российской Федерации от 23.05.2006 № 306.

Утвержденные нормативы потребления электроэнергии в жилых помещениях, а также при использовании надворных построек, расположенных на земельном участке, будут применяться в отношении жителей, которые не имеют индивидуальных приборов учета.

Нормативы потребления электроэнергии в целях содержания общего имущества в многоквартирном доме будут применяться при расчете платы за электроэнергию для содержания общего имущества. При этом новые нормативы содержат детальную структуру энергопотребляющих установок, что позволит производить расчет платы за электроэнергию для содержания общего имущества, исходя из оснащенности оборудованием конкретного дома.

С момента вступления в силу решений управления по тарифам от 16.11.2018 №188,189 решения от 14.11.2012 № 154 «Об утверждении нормативов потребления коммунальной услуги по электроснабжению на территории Алтайского края», от 29. 05.2017 года № 44 «Об утверждении нормативов потребления электрической энергии в целях содержания общего имущества в многоквартирном доме на территории Алтайского края» утратят силу.

Отметим, что проекты новых нормативов прошли обсуждение и получили одобрение на Общественном совете при управлении по тарифам.


Количество показов: 2662
Дата изменения: 16.11.2018 11:54:58

О порядке расчета платы за электроснабжение в местах общего и вспомогательного пользования

Версия портала для слабовидящих включает в себя: возможность изменения размеров шрифта, выбора цветовой схемы, а также содержит функцию «включить / выключить» изображения.

Посетитель портала может настраивать данные параметры после перехода к версии для слабовидящих.

Используя настройку «Размер шрифта», можно выбрать один из трех предлагаемых размеров шрифта.
При помощи настройки «Цветовая схема» пользователь может установить наиболее удобную для него цветовую схему портала (бело-черная, черно-белая и фиолетово-желтая).

Нажав кнопку «Выкл.» / «Вкл.» можно включить или выключить показ изображений, размещенных на портале. При выключении функции «Изображения», на месте изображений появится альтернативный тест.

Все настройки пользователя автоматически сохраняются в cookie браузера и используются для отображения страниц при каждом визите на сайт, при условии, что посетитель портала не выходил из текущей версии.

По умолчанию выбираются следующие параметры: размер шрифта – 22px, бело-черная цветовая схема и включенные изображения.

Для того чтобы вернуться к обычной версии, необходимо нажать на иконку.

Увеличить размер текста можно воспользовавшись другими способами: 

Включение Экранной лупы Windows: 

1. Через меню Пуск:

Пуск → Все программы → Стандартные → Специальные возможности → Экранная лупа.

2. Через Панель управления:

Панель управления → Специальные возможности → Центр специальных возможностей → Включить экранную лупу.

3. С помощью сочетания клавиш «Windows и ”+”».

Использование сочетания клавиш:

1. В браузерах Internet Explorer, Mozilla Firefox, Google Chrom, Opera используйте сочетание клавиш Ctrl + “+” (увеличить), Ctrl + “-” (уменьшить).

2. В браузере Safari используйте сочетание клавиш Cmd + “+” (увеличить), Cmd + “-” (уменьшить).

Настройка высокой контрастности на компьютере возможна двумя способами:

1. Через Панель управления:

Пуск → Все программы → Стандартные → Центр специальных возможностей → и выбираете из всех имеющихся возможностей «Настройка высокой контрастности».

2. Использование «горячих клавиш»: 

Shift (слева) + Alt (слева) + Print Screen, одновременно.

 

Школа потребителя

Школа ПОТРЕБИТЕЛЯ

Электроэнергия на общедомовые нужды

 На свой вопрос найди ответ!

 

Расчёт ОДН  по-новому

Вопрос: – Как будет рассчитываться  ОДН по новым Правилам?

Ответ: – Сразу хочется отметить, что в целом по дому объём электроэнергии, потреблённой на общедомовые нужды, от применения новых Правил не изменится. Как и прежде, он будет определяться как разница между  расходом электроэнергии по общедомовому прибору учёта и суммарным расходом по всем жилым и нежилым помещениям.

Несколько иначе будет определяться объём ОДН при отсутствии общедомового прибора учёта, если раньше норматив на ОДН был установлен на 1 проживающего, то теперь он устанавливается на 1 квадратный метр общего имущества собственников дома.

Значительно изменится с 1 января 2013 года порядок распределения электроэнергии на ОДН внутри дома, теперь размер платежа зависит не от объёма индивидуального потребления как раньше, а от площади занимаемого помещения.  Существенным является также и то, что с этого года нежилые помещения, расположенные в многоквартирных домах и принадлежащие юридическим лицам, так же участвуют в распределении объёма электроэнергии на общедомовые нужды, и оплачивают ОДН наравне с жильцами дома, пропорционально занимаемой площади, но по ценам для юридических лиц.  

Вопрос: – Какие факторы теперь не влияют на распределение ОДН?

Ответ: – Согласно новым Правилам, распределение ОДН на каждую конкретную квартиру теперь не зависит ни от расхода электроэнергии в этой квартире, ни от количества проживающих. Распределение производится пропорционально площади, а это значит, что равные по площади квартиры будут оплачивать одинаковый объём ОДН, даже если потребление в этих квартирах будет отличаться кратно.

Вопрос: – Будет ли выставляться ОДН хозяевам квартир, в которых никто не проживает?

Ответ: – По старым Правилам, утверждённым Постановлением Правительства № 307, если в квартире никто не проживал, то расход электроэнергии по квартире был «ноль», и ОДН по «старому» принципу пропорционально расходу составлял «ноль». С 1 января 2013 года ОДН распределяется и на те квартиры, где никто не живёт и электроэнергия не потребляется, пропорционально площади.

Вопрос: – Если нет счётчика или в течение какого-то времени не передаются показания прибора учёта, как будут выставлять счёт за электроэнергию?

Ответ: – Если в Вашей квартире не установлен прибор учёта электрической энергии, что, кстати, является нарушением Федерального закона № 261 «Об энергосбережении», обязавшего собственников установить приборы учёта на все энергоресурсы ещё до 1 июля 2012 года, то расчёт будет произведён с использованием новых нормативов потребления коммунальных услуг в жилых помещениях. Нормативы были утверждены Приказом Департамента ЖКХ и государственного жилищного надзора Томской области № 47 от 30.11.2012 г и применяются с 1 января 2013 г.

Если же прибор учёта в вашей квартире установлен, но показания по каким-либо причинам не были переданы, то расчёт будет производиться по «среднему» расходу по данным за предыдущие периоды, а через 3 месяца – исходя из нормативов потребления коммунальной услуги по электроснабжению.

Обращаем Ваше внимание и на то, что утверждены абсолютно новые нормативы потребления для частных домов: на освещение помещений и приготовление пищи для сельскохозяйственных животных.

Вопрос: – Какие факторы влияют на то что, платежи за ОДН очень высокие?

Ответ: – Таких факторов несколько и они хорошо знакомы специалистам «Томскэнергосбыта».  На «высокие» ОДН влияет отсутствие индивидуальных приборов учёта и арифметика здесь проста: нет счётчика – расчёт ведётся по нормативу, при этом, как правило, фактическое потребление значительно больше, разница падает в ОДН. Обратите внимание на техническое состояние внутридомовых сетей, их ненадлежащие состояние и ветхость – причина потерь электроэнергии внутри дома. Зачастую фактическая нагрузка дома, то есть мощность подключённых электроприборов, значительно превышает возможности электрических сетей дома, построенного несколько десятков лет назад, а это уже не только сказывается на увеличении потерь в доме, но и рискованно с точки зрения пожарной безопасности. Вносят свою лепту и хищения электроэнергии, то есть незаконные подключения к внутридомовым сетям. Кроме того, для корректного определения объёмов ОДН необходимы показания всех приборов учёта в доме, снятые синхронно, в том числе и с общедомового прибора учёта.

Вопрос: – Что нужно сделать для того, чтобы снизить оплату за ОДН?

Ответ: – Необходима 100% установка индивидуальных приборов учёта, причём не за закрытыми дверями в квартирах, а в месте, доступном для снятия показаний. Должно производиться надлежащее техническое обслуживание электрохозяйства дома. Часто можно слышать от жителей, что управляющие компании не хотят полноценно заниматься обслуживанием внутридомовых сетей и оборудования, компания «Томскэнергосбыт» готова оказывать жителям такие услуги. Электрохозяйство в доме будет приведено в порядок, снижаются потери, исключаются незаконные подключения, внедряются энергосберегающие технологии. Для этого решением собственников жилья  вы можете нанять специализированную организацию для обслуживания электрического хозяйства дома, пересмотрев договор с управляющей компанией.

Как узнать больше об электроэнергии на ОДН?

г. Томск 

Контакт-центр – 8 800 200 47 87– звонок бесплатный или (48 47 87)

Как предлагает экономить ПАО «Томскэнергосбыт»?!

Для своих клиентов ПАО «Томскэнергосбыт», в соответствии с 

законодательством об энергосбережении, разработала типовой 

перечень мероприятий по энергосбережению в жилом доме.

Если вопрос энергосбережения является для вас актуальным и вам не маловажна величина начисления за электроэнергию на общедомовые нужды, ПАО «Томскэнергосбыт» готов разработать и реализовать индивидуальный проект по энергосбережению для вашего дома.

Для этого мы рекомендуем Вам следующие действия:

Этап 1. Установить (заменить) приборы учёта.

Обязательная мера во исполнение требования законодательства об энергосбережении.

(ФЗ РФ № 261-ФЗ от 23.11.2009).

Результат – чёткий учёт потреблённых энергоресурсов.

Этап 3. Провести энергоаудит дома.

Обеспечит продолжительную и надежную работу счетчиков, всего внутридомового оборудования и внутридомовых сетей. Результат – контроль над состоянием приборов учета, точный учет потребленных энергоресурсов, содержание внутридомового оборудования и внутридомовых сетей в надлежащем виде.

Этап 3. Провести энергоаудит дома.

Необходим для выявления и диагностики состояния внутридомовых сетей и внутридомового оборудования.Результат – составление энергетического паспорта, выявление технического состояния электрохозяйства вашего дома и определение проблемных мест.

Этап 4. Заключить энергосервисный договор.

Позволит провести комплекс работ по улучшению состояния внутридомового электрооборудования, сетей, а так же внедрить энергосберегающие технологии. Результат – экономия и энергосбережение.

  

Центр обслуживания клиентов ПАО «Томскэнергосбыт» (ЦОК) готов

оказать весь комплекс услуг на пути к энергосбережению в вашем доме.

 

Контакты ПАО «Томскэнергосбыт» 

Преимущества от реализации каждого из этапов очевидны:

  • Снижение оплаты за ОДН.

  • Улучшение состояния внутридомовых сетей.

  • Повышение надёжности энергоснабжения.

  • Обеспечение безопасности. В частности, снижение риска возникновения происшествий по причине возгорания, вызванного неудовлетворительным состоянием внутридомовых сетей.

  • Внедрение энергосберегающих технологий.

 

Нормативы потребления коммунальных услуг

НОРМАТИВЫ ПОТРЕБЛЕНИЯ КОММУНАЛЬНЫХ УСЛУГ, ДЕЙСТВУЮЩИЕ В АЛТАЙСКОМ КРАЕ
ГАЗОСНАБЖЕНИЕ
НОРМАТИВЫ ПОТРЕБЛЕНИЯ

ЭЛЕКТРОЭНЕРГИЯ

Решение управления по государственному регулированию цен и тарифов от 16.11.2018 №188 «Об утверждении нормативов потребления коммунальной услуги по электроснабжению в жилых помещениях на территории Алтайского края» (вступило в силу 16 ноября 2018 года)


Решение управления Алтайского края по государственному регулированию цен и тарифов от 16. 11.2018 №189 «Об утверждении нормативов потребления электрической энергии в целях содержания общего имущества в многоквартирном доме и нормативов потребления коммунальной услуги по электроснабжению при использовании надворных построек, расположенных на земельном участке, на территории Алтайского края» (вступило в силу с 16 ноября 2018 года)

ВОДОСНАБЖЕНИЕ, ВОДООТВЕДЕНИЕ


1. НОРМАТИВЫ ПОТРЕБЛЕНИЯ КОММУНАЛЬНЫХ УСЛУГ ПО ХОЛОДНОМУ (ГОРЯЧЕМУ) ВОДОСНАБЖЕНИЮ, ВОДООТВЕДЕНИЮ В ЖИЛЫХ ПОМЕЩЕНИЯХ НА ТЕРРИТОРИИ АЛТАЙСКОГО КРАЯ (действуют с 3 мая 2018 года)

2. Нормативы расхода тепловой энергии на подогрев холодной воды для предоставления коммунальной услуги по горячему водоснабжению в жилых помещениях на территории Алтайского края (действуют с 1 июля 2018 года)

3. Нормативы потреб­ления холодной (горячей) воды в це­лях содержания общего имущества в многоквартирном доме  на территории Алтайского края” (действуют с 1 июня 2017 года)

4. Нормативы потребления  отведения сточных вод  в целях содержания общего имущества в многоквартирном доме на территории Алтайского края  (действуют с 1 ноября 2017 года)

5.  Нормативы потребления коммунальной услуги по холодному водоснабжению при использовании земельного участка и надворных построек на территории Алтайского края (действуют с 1 августа 2015 года)  
Внесение изменений в решение об утверждении нормативов потребления коммунальной услуги по холодному водоснабжению при использовании земельного участка и надворных построек:  Решение от 06.07.2016 №93 “О некоторых правовых актах управления Алтайского края по государственному регулированию цен и тарифов”; Решение управления Алтайского края по государственному регулированию цен и тарифов от 28.04.2018 № 54 “Об утверждении нормативов потребления коммунальных услуг по холодному (горячему) водоснабжению, водоотведению в жилых помещениях на территории Алтайского края”

ТЕПЛОСНАБЖЕНИЕ
НОРМАТИВЫ ПОТРЕБЛЕНИЯ

ТВЕРДЫЕ КОММУНАЛЬНЫЕ ОТХОДЫ (ТКО)

Решение управления по государственному регулированию цен и тарифов от 10.12.2020 №432 «Об установлении нормативов накопления твердых коммунальных отходов на территории Алтайского края» (вступает в силу 01 июля 2021 года)

НОРМАТИВЫ ПОТРЕБЛЕНИЯ (настоящее решение вступает в силу с момента присвоения юридическому лицу, действующему на территории Алтайского края, статуса регионального оператора и определения зоны его деятельности на основании конкурсного отбора, который проводится уполномоченным органом исполнительной власти Алтайского края в порядке, установленном Правительством Российской Федерации)


____________________________________________________________________________________________________

Порядок предоставления документов для установления нормативов потребления коммунальных услуг Порядок предоставления документов для установления нормативов потребления коммунальных услуг на территории Алтайского края по инициативе ресурсоснабжающих организаций или управляющих организаций (решение от 26. 08.2015 № 134)


_______________________________________________________________________________________

Типовые условия использования общедоступной информации, размещаемой в информационно-телекоммуникационной сети«Интернет» в форме открытых данных (утверждены протоколом заочного голосования Правительственной комиссии по координации деятельности открытого правительства от 19 сентября 2016 г. № 6)

CDM: Методологии

Описание ошибки

Ошибка сайта

При публикации этого ресурса произошла ошибка.

Ресурс не найден

К сожалению, запрошенный ресурс не существует.

Проверьте URL-адрес и повторите попытку.

Источник: https://cdm.unfccc.int/methodologies/pamethodologies


Предложения по устранению неполадок

<ул>
  • URL может быть неправильным.
  • Параметры, переданные этому ресурсу, могут быть неверными.
  • Ресурс, от которого зависит этот ресурс, может быть обнаружена ошибка.
  • Для получения более подробной информации об ошибке, пожалуйста, обратитесь к журналу ошибок.

    Если ошибка повторяется, обратитесь к специалисту по обслуживанию сайта. Спасибо за терпеливость.

    NotFound(‘

    Ошибка сайта

    \n

    При публикации этого ресурса произошла ошибка.\n

    \n

    Ресурс не найден

    \n\n Извините, запрошенный ресурс не существует.

    Проверьте URL и повторите попытку.

    Источник: https://cdm.unfccc.int/methodologies/pamethodologies

    \n
    \n\n

    Устранение неполадок Предложения

    \n\n
      \n
    • URL-адрес может быть неверным.
    • \n
    • Параметры, переданные этому ресурсу, могут быть неверными.
    • \n
    • Ресурс, от которого зависит этот ресурс, может\n столкнуться с ошибкой.
    • \n
    \n\n

    Для получения более подробной информации об ошибке, пожалуйста, \n обратитесь к журналу ошибок. \n

    \n\n

    Если ошибка повторится, обратитесь к администратору сайта.\n Спасибо за терпение.\n

    ‘,)

    Калькулятор простой приведенной стоимости энергии (LCOE) Документация | Энергетический анализ

    Это простой калькулятор LCOE для получения показателя, который позволяет сравнивать комбинацию капитальных затрат, Эксплуатация и техническое обслуживание, производительность и затраты на топливо.Обратите внимание, что это не включает вопросы финансирования, проблемы со скидками, будущие затраты на замену или деградацию и т. д., которые необходимо будет включить для более сложного анализа.

    Финансовые предположения

    Настройте ползунки на подходящие значения для срока хранения в годах и ставки дисконтирования. В ставка дисконтирования может быть номинальной или реальной. Используя периоды и ставку дисконтирования, мы рассчитываем коэффициент восстановления капитала (CRF).п]-1}

    , где n — количество полученных аннуитетов. Это связано с формулой аннуитета, который дает текущую стоимость с точки зрения аннуитета, процентной ставки и количество аннуитетов. Если n = 1, CRF сводится к 1 + i. Когда n стремится к бесконечности, CRF переходит к i (Источник: 1).

    Стоимость и производительность

    Настройте ползунки на подходящие значения для каждого из значений стоимости и производительности.

    Простой расчет приведенной стоимости энергии

    Простая приведенная стоимость энергии рассчитывается по следующей формуле:

    sLCOE = {(первоначальные капитальные затраты * коэффициент возмещения капитала + фиксированные затраты на эксплуатацию и техническое обслуживание)/(8760 * коэффициент мощности)} + (стоимость топлива * тепловая мощность) + переменные затраты на эксплуатацию и техническое обслуживание.

    Если капитальные затраты на ночь измеряются в долларах за установленный киловатт ($/кВт), коэффициент восстановления капитала представляет собой дробь, рассчитанную, как описано выше.Фиксированная операция и затраты на техническое обслуживание (O&M) в долларах за киловатт-год ($/кВт-год) и переменные затраты на O&M стоимость в долларах за киловатт-час ($/кВтч).

    В знаменателе 8760 — количество часов в году, а коэффициент мощности — это дробь от 0 до 1, представляющая часть года, в течение которой электростанция генерирующая мощность.

    Стоимость топлива выражается в долларах за миллион британских тепловых единиц ($/MMBtu) и тепловая мощность измеряется в британских тепловых единицах на киловатт-час (Btu/kWh). Стоимость топлива является необязательным, поскольку некоторые генерирующие технологии, такие как солнечная и ветровая энергия, не имеют топлива расходы.

    Нормированная стоимость энергии (LCOE, также называемая Нормированной стоимостью энергии или LEC) — это стоимость производства энергии (обычно электричества) для конкретной системы. это экономический оценка стоимости энергогенерирующей системы, включая все затраты за срок службы: первоначальные инвестиции, эксплуатация и техническое обслуживание, стоимость топлива, стоимость капитал.Расчет чистой приведенной стоимости выполняется и решается таким образом, что для выбранной стоимости LCOE чистая приведенная стоимость проекта становится равной нулю (Источник: 2, 3).

    Это означает, что LCOE является минимальной ценой, по которой энергия должна быть продана за энергетический проект на безубыточность.

    Обычно LCOE рассчитываются для срока службы от 20 до 40 лет и приводятся в единиц валюты за киловатт-час, например, доллар США/кВтч или евро/кВтч или мегаватт-час.

    При сравнении LCOE для альтернативных систем важно определить границы «системы» и затрат, которые включены в нее. Например, если передачи линии и системы распределения включены в стоимость? Должны ли НИОКР, налоги и экологические включать исследования воздействия? Должны ли затраты на воздействие на здоровье населения и окружающую среду включать ущерб? Должны ли расходы на государственные субсидии включаться в расчетный НСЭ?

    Еще одним ключевым вопросом является решение о величине учетной ставки i.Значение который выбирается, потому что я часто могу «взвесить» решение в пользу того или иного варианта, поэтому необходимо тщательно оценить основу для выбора скидки. Скидка ставка зависит от стоимости капитала, включая баланс между заемным финансированием и долевое финансирование, а также оценка финансового риска.

    Источники:
    1. Участники Википедии, «Фактор восстановления капитала», Википедия, Бесплатная энциклопедия (по состоянию на 3 июня 2010 г.).
    2. участников Википедии, «Выровненная стоимость энергии», Википедия, Бесплатная энциклопедия (по состоянию на 3 июня 2010 г.).
    3. Уолтер Шорт, Дэниел Дж. Пэки и Томас Холт, Руководство по экономической оценке технологий энергоэффективности и возобновляемых источников энергии, NREL/TP-462-5173, март 1995 г.

    Введение в оценку мощности и размера выборки

    ЗАДАЧИ

    1. Понимание оценки мощности и размера выборки.

    2. Поймите, почему мощность является важной частью как дизайна исследования, так и анализа.

    3. Понимать различия между расчетами размера выборки в сравнительных и диагностических исследованиях.

    4. Узнайте, как выполнить расчет объема выборки.

      • – (а) Для непрерывных данных

      • – (b) Для прерывистых данных

      • – (в) Для диагностических тестов

    ОЦЕНКА МОЩНОСТИ И ОБЪЕМА ВЫБОРКИ

    Оценки мощности и размера выборки — это меры того, сколько пациентов необходимо для исследования.Почти все клинические исследования подразумевают изучение выборки пациентов с определенной характеристикой, а не всей популяции. Затем мы используем эту выборку, чтобы сделать выводы обо всей совокупности.

    В предыдущих статьях из серии статей о статистике, опубликованных в этом журнале, статистический вывод использовался для определения того, верны ли найденные результаты или, возможно, они обусловлены только случайностью. Ясно, что мы можем уменьшить вероятность того, что наши результаты будут случайными, устранив предвзятость в дизайне исследования, используя такие методы, как рандомизация, ослепление и т. д.Однако на вероятность того, что наши результаты могут быть неверными, влияет еще один фактор — количество обследованных пациентов. Интуитивно мы предполагаем, что чем больше доля всего изучаемого населения, тем ближе мы подойдем к истинному ответу для этого населения. Но сколько нам нужно изучить, чтобы подобраться как можно ближе к правильному ответу?

    ЧТО ТАКОЕ СИЛА И ПОЧЕМУ ОНА ВАЖНА

    Оценки мощности и размера выборки используются исследователями, чтобы определить, сколько испытуемых необходимо, чтобы ответить на вопрос исследования (или нулевую гипотезу).

    Примером может служить случай тромболизиса при остром инфаркте миокарда (ОИМ). В течение многих лет клиницисты считали, что это лечение принесет пользу, учитывая предполагаемую этиологию ОИМ, однако последовательные исследования не смогли доказать это. Лишь после завершения достаточно мощных «мега-испытаний» была доказана небольшая, но важная польза от тромболизиса.

    Обычно в этих исследованиях тромболизис сравнивали с плацебо, и часто в качестве первичного критерия исхода использовали смертность через определенное количество дней.Основная гипотеза исследований могла заключаться в сравнении, например, смертности на 21-й день тромболизиса по сравнению с плацебо. Тогда есть две гипотезы, которые нам нужно рассмотреть:

    1. Нулевая гипотеза состоит в том, что нет никакой разницы между методами лечения с точки зрения смертности.

    2. Альтернативная гипотеза заключается в том, что существует разница между методами лечения с точки зрения смертности.

    Пытаясь определить, являются ли две группы одинаковыми (принимая нулевую гипотезу) или они различаются (принимая альтернативную гипотезу), мы потенциально можем совершить два вида ошибок.Они называются ошибкой первого рода и ошибкой второго рода.

    Говорят, что ошибка первого рода возникает, когда мы неправильно отвергаем нулевую гипотезу (то есть, она верна и между двумя группами нет различий) и сообщаем о различиях между двумя изучаемыми группами.

    Говорят, что ошибка типа II возникает, когда мы неправильно принимаем нулевую гипотезу (то есть она ложна и существует различие между двумя группами, которая является альтернативной гипотезой) и сообщаем, что между двумя группами нет различий.

    Их можно представить в виде таблицы два на два (таблица 1).

    Расчет мощности говорит нам, сколько пациентов требуется, чтобы избежать ошибки типа I или типа II.

    Термин «мощность» обычно используется в отношении всех оценок размера выборки в исследованиях. Строго говоря, «мощность» означает количество пациентов, необходимое для того, чтобы избежать ошибки II типа в сравнительном исследовании. Оценка размера выборки — это более широкий термин, который рассматривает не только ошибку типа II и применим ко всем типам исследований.В просторечии эти термины используются взаимозаменяемо.

    ЧТО ВЛИЯЕТ НА СИЛУ ИССЛЕДОВАНИЯ?

    Существует несколько факторов, которые могут повлиять на силу исследования. Их следует учитывать на ранних этапах разработки исследования. Некоторые факторы мы можем контролировать, другие нет.

    Прецизионность и дисперсия измерений в любом образце

    Почему исследование может не обнаружить разницы, если она действительно есть? Для любого заданного результата выборки пациентов мы можем только определить распределение вероятностей вокруг этого значения, которое подскажет, где находится истинное значение популяции.Наиболее известным примером этого являются 95% доверительные интервалы. Размер доверительного интервала обратно пропорционален количеству исследуемых субъектов. Таким образом, чем больше людей мы изучаем, тем точнее мы можем определить, где находится истинная ценность населения.

    На рис. 1 показано, что для одного измерения чем больше изучаемых субъектов, тем уже становится распределение вероятностей. В группе 1 среднее значение равно 5 с широкими доверительными интервалами (3–7). При удвоении числа обследованных пациентов (но в нашем примере значения остались прежними) доверительные интервалы сузились (3.5–6.5), что дает более точную оценку истинного среднего значения генеральной совокупности.

    Рисунок 1

    Изменение ширины доверительного интервала с увеличением числа субъектов.

    Распределение вероятности того, где находится истинное значение, является неотъемлемой частью большинства статистических тестов для сравнений между группами (например, тесты t ). Исследование с небольшим размером выборки будет иметь большие доверительные интервалы и будет отображаться как статистически ненормальное только в том случае, если между двумя группами существует большая разница.Рисунок 2 демонстрирует, как увеличение числа субъектов может дать более точную оценку различий.

    Рисунок 2

    Эффект уменьшения доверительного интервала для демонстрации истинной разницы в средних значениях. Этот пример показывает, что первоначальное сравнение между группами 1 и 3 не показало статистической разницы, поскольку доверительные интервалы перекрывались. В группах 3 и 4 число больных удваивается (хотя среднее значение остается прежним). Мы видим, что доверительные интервалы больше не перекрываются, что указывает на то, что разница в средних значениях вряд ли возникла случайно.

    Величина клинически значимой разницы

    Если мы пытаемся обнаружить очень небольшие различия между методами лечения, требуются очень точные оценки истинного значения популяции. Это связано с тем, что нам нужно очень точно найти истинное значение популяции для каждой группы лечения. И наоборот, если мы находим или ищем большое различие, может быть приемлемым довольно широкое распределение вероятностей.

    Другими словами, если мы ищем большое различие между методами лечения, мы могли бы принять широкое распределение вероятностей, если мы хотим обнаружить небольшое различие, нам потребуется большая точность и малые распределения вероятностей.Поскольку ширина распределения вероятностей в значительной степени определяется тем, сколько субъектов мы изучаем, ясно, что искомая разница влияет на расчеты размера выборки.

    Факторы, влияющие на расчет мощности
    • Прецизионность и дисперсия измерений в любом образце

    • Величина клинически значимой разницы

    • Насколько уверены мы, чтобы избежать ошибки 1-го типа

    • Тип статистического теста, который мы выполняем

    При сравнении двух или более образцов мы обычно мало контролируем размер эффекта. Тем не менее, мы должны убедиться, что разница стоит обнаружения. Например, можно разработать исследование, которое продемонстрирует сокращение времени начала местной анестезии с 60 до 59 секунд, но такая небольшая разница не будет иметь клинического значения. И наоборот, исследование, демонстрирующее разницу от 60 секунд до 10 минут, явно будет. Указание того, что является «клинически важным отличием», является ключевым компонентом расчета размера выборки.

    Насколько важна ошибка типа I или типа II для рассматриваемого исследования?

    Мы можем указать, насколько мы были бы обеспокоены тем, чтобы избежать ошибки типа I или типа II.Говорят, что ошибка первого рода возникает, когда мы неправильно отвергаем нулевую гипотезу. Обычно мы выбираем вероятность <0,05 для ошибки I рода. Это означает, что если мы найдем положительный результат, шансы найти это (или большую разницу) будут менее чем в 5% случаев. Этот показатель, или уровень значимости, обозначается как pα и обычно предварительно устанавливается нами на ранней стадии планирования исследования при расчете размера выборки. По соглашению, а не по дизайну, мы чаще всего выбираем 0.05. Чем ниже уровень значимости, тем ниже мощность, поэтому использование 0,01 соответственно уменьшит нашу мощность.

    (Чтобы избежать ошибки первого рода, т. е. если мы найдем положительный результат, шансы обнаружить это или большее различие возникнут менее чем в α% случаев)

    Говорят, что ошибка типа II возникает, когда мы неверно принимаем нулевую гипотезу и сообщаем, что между двумя группами нет различий. Если действительно есть разница между вмешательствами, мы выражаем вероятность получения ошибки второго рода и вероятность того, что мы ее обнаружим.Эта цифра обозначается как pβ. В отношении приемлемого уровня pβ существует меньше условностей, но распространены цифры 0,8–0,9 (то есть, если разница между вмешательствами действительно существует, мы обнаружим ее в 80–90% случаев)

    .

    Предотвращение ошибки второго рода является сутью расчетов мощности. Мощность исследования, pβ, представляет собой вероятность того, что исследование обнаружит заранее определенное различие в измерениях между двумя группами, если оно действительно существует, при заданном значении pα и размере выборки N.

    Тип статистического теста, который мы выполняем

    Расчеты размера выборки показывают, как статистические тесты, использованные в исследовании, могут работать. Поэтому неудивительно, что тип используемого теста влияет на то, как рассчитывается размер выборки. Например, параметрические тесты лучше находят различия между группами, чем непараметрические тесты (именно поэтому мы часто пытаемся преобразовать базовые данные в нормальные распределения). Следовательно, для анализа, основанного на непараметрическом тесте (например, U Манна-Уитни), потребуется больше пациентов, чем для анализа, основанного на параметрическом тесте (например, критерий Стьюдента t ).

    СЛЕДУЕТ ЛИ РАСЧЕТ ОБЪЕМА ВЫБОРКИ ДО ИЛИ ПОСЛЕ ИССЛЕДОВАНИЯ?

    Ответ определенно до, иногда во время, а иногда и после.

    При разработке исследования мы хотим убедиться, что проделанная нами работа стоит того, чтобы мы получили правильный ответ и получили его наиболее эффективным способом. Это делается для того, чтобы мы могли набрать достаточное количество пациентов, чтобы придать нашим результатам адекватную силу, но не слишком много, чтобы тратить время на получение большего количества данных, чем нам нужно.К сожалению, при разработке исследования нам, возможно, придется сделать предположения о желаемом размере эффекта и дисперсии данных.

    Промежуточные расчеты мощности иногда используются, когда известно, что данные, использованные в первоначальном расчете, сомнительны. Их следует использовать с осторожностью, поскольку повторный анализ может привести к тому, что исследователь прекратит исследование, как только будет получена статистическая значимость (что может произойти случайно несколько раз во время набора участников). После начала исследования анализ промежуточных результатов может быть использован для выполнения дальнейших расчетов мощности и соответствующих корректировок размера выборки.Это может быть сделано, чтобы избежать преждевременного прекращения исследования или, в случае спасения жизни или опасных методов лечения, чтобы избежать продления исследования. Расчеты промежуточного размера выборки следует использовать только в том случае, если это указано в методе априорного исследования.

    Когда мы оцениваем результаты испытаний с отрицательными результатами, особенно важно задаться вопросом о размере выборки исследования. Вполне может быть, что исследование было недостаточно мощным и что мы неправильно приняли нулевую гипотезу, что является ошибкой второго рода.Если бы в исследовании участвовало больше субъектов, то разница вполне могла бы быть обнаружена. В идеальном мире этого никогда не должно происходить, потому что расчет размера выборки должен появляться в разделе методов всех статей, реальность показывает нам, что это не так. Как потребители исследований, мы должны иметь возможность оценить силу исследования на основании полученных результатов.

    Расчет размера ретроспективной выборки в этой статье не рассматривается. Несколько калькуляторов для ретроспективного размера выборки доступны в Интернете (калькуляторы мощности UCLA (http://calculators. stat.ucla.edu/powercalc/), интерактивные статистические страницы (http://www.statistics.com/content/javastat.html).

    ДЛЯ КАКОГО ТИПА ИССЛЕДОВАНИЙ ДОЛЖЕН ВЫПОЛНЯТЬСЯ РАСЧЕТ МОЩНОСТИ?

    Почти все количественные исследования могут быть подвергнуты расчету размера выборки. Однако они могут иметь небольшое значение в ранних поисковых исследованиях, когда имеются скудные данные, на которых можно основывать расчеты (хотя это можно решить, сначала проведя пилотное исследование и используя полученные данные).

    Ясно, что расчеты размера выборки являются ключевым компонентом клинических испытаний, поскольку акцент в большинстве этих исследований делается на выявление величины различий между методами лечения. Все клинические испытания должны иметь оценку размера выборки.

    В других типах исследований необходимо проводить оценку размера выборки, чтобы повысить точность наших окончательных результатов. Например, основными показателями результатов для многих диагностических исследований будут чувствительность и специфичность конкретного теста, обычно сообщаемые с доверительными интервалами для этих значений. Как и в случае со сравнительными исследованиями, чем больше изучаемых пациентов, тем больше вероятность того, что результаты выборки будут отражать истинную ценность популяции. Выполняя расчет размера выборки для диагностического исследования, мы можем указать точность, с которой мы хотели бы сообщить доверительные интервалы для чувствительности и специфичности.

    Поскольку клинические испытания и диагностические исследования, вероятно, составляют основу исследовательской работы в области медицины неотложных состояний, мы сосредоточились на них в этой статье.

    МОЩНОСТЬ В СРАВНИТЕЛЬНЫХ ИСПЫТАНИЯХ

    Исследования, сообщающие непрерывные данные с нормальным распределением

    Предположим, что Эгберт Эверард стал участником клинических испытаний с участием пациентов с гипертонией. Новый антигипертензивный препарат Jabba Juice сравнивали с бендрофлуазидом в качестве нового препарата первой линии для лечения гипертонии (таблица 2).

    Стол 2

    Эгберт записывает некоторые вещи, которые, по его мнению, важны для расчетов

    Как видите, значения pα и pβ несколько типичны.Обычно они устанавливаются по соглашению, а не меняются от одного исследования к другому, хотя, как мы увидим ниже, они могут меняться.

    Ключевым требованием является «клинически важное различие», которое мы хотим обнаружить между группами лечения. Как обсуждалось выше, это различие должно быть клинически важным, поскольку, если оно очень мало, о нем, возможно, не стоит знать.

    Еще одна цифра, которую нам необходимо знать, — это стандартное отклонение переменной в исследуемой популяции.Измерения артериального давления представляют собой форму нормально распределенных непрерывных данных и, как таковые, будут иметь стандартное отклонение, которое Эгберт обнаружил в других исследованиях, посвященных аналогичным группам людей.

    Как только мы узнаем эти две последние цифры, мы можем вычислить стандартизированную разницу, а затем использовать таблицу, чтобы получить представление о необходимом количестве пациентов.

    Разница между средними значениями представляет собой клинически важную разницу, то есть она представляет собой разницу между средним артериальным давлением в группе бендрофлуазида и средним артериальным давлением в группе нового лечения.

    Из каракулей Эгберта:

    Используя таблицу 3, мы видим, что при стандартизированной разнице 0,5 и уровне мощности (pβ) 0,8 необходимое количество пациентов составляет 64. Эта таблица предназначена для односторонней гипотезы, (?) нулевая гипотеза требует, чтобы исследование быть достаточно мощным, чтобы определить, лучше или хуже одно лечение, чем другое, поэтому нам потребуется как минимум 64 × 2 = 128 пациентов. Это делается для того, чтобы мы получали пациентов, попадающих в обе стороны от средней разницы, которую мы установили.

    Стол 3

    Как изменяется мощность при стандартной разнице

    Другим методом определения размера выборки является использование номограммы, разработанной Гором и Альтманом 2 , как показано на рисунке 3.

    Рисунок 3

    Номограмма для расчета объема выборки.

    Исходя из этого, мы можем использовать линейку, чтобы соединить стандартизированную разность с мощностью, необходимой для исследования.Там, где край пересекает среднюю переменную, указывается требуемое число N.

    Номограмму также можно использовать для расчета мощности сравнения двусторонней гипотезы непрерывного измерения с одинаковым количеством пациентов в каждой группе.

    Если данные не распределены нормально, номограмма ненадежна, и следует обратиться за официальной статистической помощью.

    Исследования, сообщающие категориальные данные

    Предположим, что Эгберт Эверард в своем постоянном стремлении улучшить уход за пациентами, страдающими от инфаркта миокарда, был убежден представителем фармацевтической компании помочь в проведении исследования нового посттромболизисного препарата Jedi Flow. Из предыдущих исследований он знал, что потребуются большие числа, поэтому провел расчет размера выборки, чтобы определить, насколько сложной будет задача (таблица 4).

    Стол 4

    Расчет объема выборки

    И снова значения pα и pβ являются стандартными, и мы установили уровень для клинически важной разницы.

    В отличие от непрерывных данных расчет размера выборки для категорийных данных основан на пропорциях.Однако, как и в случае с непрерывными данными, нам все еще необходимо рассчитать стандартизованную разницу. Это позволяет нам использовать номограмму для расчета необходимого количества пациентов.

    p 1 = пропорциональная смертность в группе тромболизиса = 12% или 0,12

    p 2 = пропорциональная смертность в группе Jedi Flow = 9% или 0,09 (это 3% клинически важная разница в смертности, которую мы хотим показать).

    P=(p 1+ p 2 )/2=

    Стандартизированная разница составляет 0,1. Если мы воспользуемся номограммой и проведем линию от 0,1 до оси мощности на уровне 0,8, мы увидим пересечение с центральной осью на уровне 0,05 pα, нам потребуется 3000 пациентов в исследовании. Это означает, что нам нужно 1500 пациентов в группе Jedi Flow и 1500 в группе тромболизиса.

    МОЩНОСТЬ В ДИАГНОСТИЧЕСКИХ ИСПЫТАНИЯХ

    Расчеты мощности редко используются в диагностических исследованиях, и, по нашему опыту, немногие знают о них. Они имеют особое значение для практики неотложной медицинской помощи из-за характера нашей работы. Описанные здесь методы взяты из работы Будерера. 3

    Доктор Эгберт Эверард решает, что диагностика переломов лодыжек может быть улучшена за счет использования нового ручного ультразвукового устройства в отделении неотложной помощи на Звезде Смерти. Устройство DefRay используется для осмотра лодыжки и позволяет определить, сломана лодыжка или нет. Доктор Эверард считает, что это новое устройство может снизить потребность пациентов в часах ожидания в рентгенологическом отделении, тем самым избегая боли в ушах у пациентов, когда они возвращаются. Он считает, что DefRay можно использовать в качестве инструмента скрининга, только те пациенты с положительным тестом DefRay будут отправлены в рентгенологическое отделение для демонстрации точного характера травмы.

    Он разрабатывает диагностическое исследование, в котором все пациенты с подозрением на перелом лодыжки обследуются в отделении неотложной помощи с помощью DefRay.Этот результат записывается, а затем пациентов отправляют на рентгенограмму независимо от результата теста DefRay. Затем доктор Эверард и его коллега сравнивают результаты DefRay со стандартной рентгенограммой.

    Пропущенные переломы лодыжки стоили отделению доктора Эверарда больших денег в прошлом году, и поэтому очень важно, чтобы DefRay работал хорошо, если он будет принят в качестве скринингового теста. Эгберту интересно, сколько пациентов ему понадобится. Он делает записи (таблица 5).

    Стол 5

    Расчеты Эверарда

    Для диагностического исследования мы рассчитываем мощность, необходимую для достижения адекватной чувствительности или адекватной специфичности. Расчеты обходят стандартный способ представления диагностических данных «два на два», как показано в таблице 6.

    Стол 6

    Таблица отчетов «два на два» для диагностических тестов

    Для расчета потребности в адекватной чувствительности

    Для расчета потребности в адекватной специфичности

    Если бы Эгберт был в равной степени заинтересован в тесте со специфичностью и чувствительностью, мы бы выбрали больший из двух, но он этого не делает. Он больше всего заинтересован в том, чтобы убедиться, что тест имеет высокую чувствительность, чтобы исключить переломы лодыжки. Поэтому он берет для чувствительности цифру 243 пациента.

    ЗАКЛЮЧЕНИЕ

    Оценка размера выборки является ключом к проведению эффективных сравнительных исследований. Понимание концепций мощности, размера выборки и ошибок первого и второго рода поможет исследователю и критическому читателю медицинской литературы.

    ВИКТОРИНА

    1. Какие факторы влияют на расчет мощности для пробной терапии?

    2. Доктор Эгберт Эверард хочет протестировать новый анализ крови (Sithtastic) для диагностики гена темной стороны. Он хочет, чтобы тест имел чувствительность не менее 70 % и специфичность 90 % с уровнем достоверности 5 %. Распространенность заболевания в этой популяции составляет 10%.

    3. Если доктор Эверард испытает новый метод лечения ожогов световым мечом, который, как надеялись, снизит смертность с 55% до 45%.Он устанавливает pα равным 0,05 и pβ равным 0,99, но обнаруживает, что ему нужно много пациентов, поэтому, чтобы облегчить себе жизнь, он изменяет мощность на 0,80.

      1. Сколько пациентов в каждой группе ему потребовалось с pα до 0,05 и pβ до 0,80?

      2. Сколько пациентов ему понадобилось с более высокой (первоначальной) мощностью?

    Ответы на викторину

    1. См. рамку.

    2. (i) 2881 пациент; (ii) 81 пациент

    3. (i) около 400 пациентов в каждой группе; (ii) около 900 пациентов в каждой группе

    Благодарности

    Мы хотели бы поблагодарить Фиону Леки, почетного старшего лектора по неотложной медицине больницы Хоуп, Солфорд, за ее помощь в подготовке этой статьи.

    ССЫЛКИ

    1. Дрисколл П , Уордроп Дж.Введение в статистику. J Accid Emerg Med2000;17:205.

    2. Гор С.М. , Альтман Д.Г. Насколько велика выборка. In: Статистика на практике . Лондон: Издательство BMJ, 2001: 6–8.

    3. Buderer NM . Статистическая методология: I. Включение распространенности заболевания в расчет размера выборки для чувствительности и специфичности. Acad Emerg Med1996;3:895–900.

    Расчет мощности | Лаборатория действий по борьбе с бедностью Абдула Латифа Джамиля

    В этом разделе представлен обзор источников для каждого компонента расчетов мощности и советы по выполнению начальных расчетов. В нем также содержится руководство по уточнению расчетов на основе интереса к бинарным или множественным результатам и конструктивным особенностям, таким как неравный размер кластера или стратифицированная рандомизация.

    Сбор входных данных

    Некоторые компоненты расчетов мощности основаны на решениях или предположениях, сделанных исследователем и партнером, тогда как другие рассчитываются с использованием существующих данных.

    На основании решений или предположений:
    • Мощность (1-κ) обычно устанавливается на 80 % или 0,8, хотя в некоторых случаях вместо этого устанавливается на 90 %. Хотя может показаться заманчивым увеличить мощность исследования, это также увеличивает риск ложноположительного результата (ошибка первого рода). См. Cohen (1988) для получения дополнительной информации.

    • Уровень значимости (α)  обычно устанавливается на уровне 5%, т. е. α = 0,05.
    • Единицы рандомизации и наблюдения: Единицы рандомизации и наблюдения могут не совпадать.См. раздел «Реализация» ресурса «Рандомизация» для получения дополнительной информации об определении каждого из них. В кластерных конструкциях, хотя добавление большего количества кластеров обычно увеличивает мощность больше, чем добавление большего количества единиц к существующим кластерам, первое обычно обходится дороже.
    • MDE может быть практически значимой величиной эффекта, такой как минимальное улучшение результатов, необходимое партнеру-исполнителю для определения того, что преимущества программы стоят затрат, или для масштабирования программы.Обратите внимание, что опубликованные исследования, оценивающие аналогичные вмешательства, обычно дают оптимистическую оценку разумного размера эффекта. Эта разница будет размыта любым несоблюдением, поэтому ожидаемый размер эффекта должен быть скорректирован с учетом ожидаемого уровня соблюдения в двух группах.
      • Если информация о реалистичных размерах эффекта недоступна, Cohen (1988) предлагает эмпирические правила, основанные на стандартных отклонениях 4 : 0,2 стандартных отклонения для малых MDE, 0,5 стандартных отклонений для средних MDE и 0. 8 стандартных отклонений для большого MDE. Однако эти стандарты основаны на лабораторных экспериментах по социальной психологии среди студентов, и с тех пор утверждалось, что они нереалистичны в реальных условиях для некоторых секторов и регионов — см., например, Kraft (2019) (сопутствующий пост в блоге) и Evans and Юань (2020 г.) (сопутствующая запись в блоге) за обсуждение того, почему более мелкие MDE могут быть более реалистичными для образовательных мероприятий.
    • В качестве альтернативы размер выборки (N) может определяться бюджетом исследования или ограничениями партнера (например,ж., количество подходящих учащихся в школах-партнерах, количество поликлиник в округе и т. д.).
    • Количество кластеров (k) и размер каждого кластера (m): Обычно дешевле опросить еще одного человека в существующем кластере, чем добавлять новый кластер из-за логистических ограничений (транспорт, расходы на персонал и т. д.). Однако снижение предельных издержек от одной дополнительной единицы в существующем кластере следует сопоставлять с уменьшением предельной мощности от каждой дополнительной единицы. Оптимальное количество кластеров и размер каждого кластера также будут меняться в зависимости от ожидаемого ICC.
    • Распределение лечения (P) можно манипулировать, чтобы максимизировать мощность или минимизировать затраты. Как написано выше, мощность обычно максимизируется при равном распределении единиц в лечебную и контрольную группы, но предоставление лечения большему количеству единиц обходится дороже. В результате возможно, что неравное распределение лечения (например, 30% лечение 70% контроль) с большим общим размером выборки будет более мощным, чем разделение 50/50 с меньшим размером выборки.Стоит протестировать различные размеры выборки и распределение лечения с учетом бюджетных ограничений, чтобы найти план, который максимизирует мощность. См. главу 6 «Проведение рандомизированных оценок» в качестве руководства по корректировке коэффициента распределения для различных практических сценариев.
    Рассчитано с использованием таких данных, как базовый или пилотный, существующих исследований или общедоступных данных:
    • Дисперсия результата (σ 2 ) идеально находится в исходных данных. Если это недоступно, его можно рассчитать с использованием других данных в той же или аналогичной популяции или найти в работах по исследованиям на аналогичные темы, предпочтительно среди аналогичных популяций.Полезные источники данных включают J-PAL/IPA Dataverses, административные данные, данные LSMS и т. д. 5 Обратите внимание, что обычно предполагается, что дисперсия результатов одинакова в разных группах лечения.

    • ICC: Точно так же ICC можно оценить, используя исходные данные, опросы и документы — все предпочтительно в той же или аналогичной популяции. См. McKenzie (2012) для объяснения одного из способов расчета ICC на основе исходных данных в Stata.

    • Принятие на работу, соответствие требованиям и отсев: Литература по предыдущим программам, подобным изучаемой, может дать приблизительное представление о возможных уровнях приема.Обратите внимание, что такая литература не обязательно должна ограничиваться академическими статьями, но может также включать белую и серую литературу, отчеты и т. д.
    Исходные расчеты

    Первоначальные расчеты должны быть сосредоточены на том, может ли исследование быть осуществимым. После того, как предлагаемый проект проходит базовую проверку осуществимости, расчеты мощности могут быть уточнены и дополнены новыми данными. При выполнении первоначальных расчетов имейте в виду следующее:

    • Выполняйте первоначальные расчеты с лучшими данными, которые легко доступны , и не увязайте в поиске доступа к закрытым данным или сортировке деталей, которые можно скорректировать.
    • Возможно, вам не потребуется искать данные для каждого компонента t для выполнения расчетов мощности. Из анализа чувствительности (ниже) вы узнаете, какие входы оказывают наибольшее влияние на мощность. Сосредоточьте усилия команды на поиске хороших оценок для наиболее важных исходных данных.
    • Точно так же, если вам не хватает информации об определенных силовых компонентах, m сделайте разумные предположения для проверки потенциальной осуществимости исследования. Например, используйте эмпирические правила для размеров эффекта, перечисленных выше: 0.2 увеличение стандартного отклонения небольшой размер эффекта; используйте это в качестве начального MDE и рассчитайте необходимый размер выборки, чтобы определить базовую осуществимость.
    • Выполните анализ чувствительности , чтобы проверить, как изменяется мощность при изменении любых критических допущений. Особое внимание уделите:
      • Ключевые допущения, такие как минимальный размер эффекта, коэффициент охвата и внутрикластерная корреляция. Будьте реалистичны и, во всяком случае, чрезмерно пессимистичны в отношении коэффициентов охвата.
      • Любая информация, которая предполагалась из-за отсутствия данных (например,г., размеры эффекта, как в пуле выше).
      • Области, в которых есть некоторая свобода действий для корректировки схемы, например, добавление единиц в кластеры, а не наоборот, изменение назначений лечения и т. д.
    • Рассмотрите как аналитические методы, так и методы моделирования. Моделированные расчеты особенно полезны для более сложных планов исследований. Они включают в себя: 1) создание поддельного набора данных с заранее определенным размером эффекта и конструктивными особенностями, 2) проверку нулевой гипотезы, 3) повторение шагов 1 и 2 много (обычно 1000 или более) раз и 4) деление общего числа отказов с шага 2 по общему количеству тестов для расчета мощности.Имея хорошие данные об исследуемой популяции, их также можно использовать для расчета смоделированных доверительных интервалов вокруг нулевых эффектов или для расчетов мощности для небольшой выборки, где некоторые параметрические предположения о распределениях вероятностей могут не выполняться. Пример кода для обоих подходов можно найти на нашем GitHub.
    Уточнение расчетов

    Если исследование выглядит многообещающим на основе первоначальных расчетов, следующие шаги заключаются в повторении деталей плана исследования и уточнении расчетов, чтобы получить более точную оценку необходимого размера выборки. Обратите внимание, что уточнения могут быть минимальными или даже не требоваться вовсе. Например, может не потребоваться дальнейшая итерация, если размер выборки фиксирован, а первоначальные расчеты, выполненные с использованием надежных и релевантных данных, показали, что план основан на широком диапазоне допущений о ICC, поглощении и т. д. С другой стороны, есть два ключевых допущения, уточнения которых могут быть особенно полезны:

    • Значительные изменения в дизайне по сравнению с тем, что предполагалось в первоначальных расчетах , например, изменение количества лечебных групп, изменение процессов приема (что может повлиять на прием), изменение единицы рандомизации или решение о необходимости выявления воздействия на конкретные подгруппы — должны информировать и получать информацию об оценках статистической мощности.

    • Более точные оценки ключевых входных данных: Если исследование прошло базовую проверку осуществимости, но были исходные данные первого порядка, для которых вы не смогли найти удовлетворительные оценки для первоначальных расчетов мощности, возможно, стоит поискать дополнительные данные для уточнения оценок мощности. . Рассмотрите возможность запроса подробных операционных данных у партнера или запроса закрытого опроса или административных данных у третьей стороны.

    Если они не включены в первоначальные расчеты, существуют дополнительные расчетные факторы, которые следует учитывать при уточнении расчетов, описанные ниже.

    Дополнительные конструктивные факторы, которые следует учитывать

    Дополнительную информацию о лежащей в основе теории того, как выбор дизайна, интерес к различным видам эффектов или использование бинарных переменных результатов влияют на расчет мощности, см. в McConnell and Vera-Hernandez (2015), Athey and Imbens (2017), Duflo et al. др. (2007) или Baird et al. (2018). Советы по включению таких проектных решений в расчеты мощности описаны ниже.

    Бинарные результаты:  Исследуемый результат может представлять собой бинарную переменную, например, трудоустроен ли человек после прохождения программы профессиональной подготовки, получил ли студент оценку после прохождения программы репетиторства и т.  д.В то время как интуиция для определения MDE и размера выборки такая же, как и для непрерывной переменной, размер эффекта и дисперсия переменной результата изменяются в зависимости от представления (логарифмическое отношение шансов или разница в вероятности) и расчетов (логистическая или линейная регрессия). ) эффекта. См. раздел 5 McConnell and Vera-Hernandez (2015) для статистического представления мощности и примера кода для бинарной переменной результата.

    Неравный размер кластера: Кластеры часто будут иметь неодинаковый размер из-за реальных ограничений в единицах разделения — это может включать как неравное количество кластеров в каждой группе лечения, так и неравное количество единиц внутри кластеров.Например, исследование, рандомизированное на уровне учителя и измеряющее результаты на уровне ученика, скорее всего, будет иметь кластеры разного размера. Если нет больших различий в размерах кластеров, требуемый общий размер выборки будет лишь немного больше для неравных кластеров, чем для равных кластеров. Дополнительную информацию см. на стр. 12 публикации McConnell and Vera-Hernandez (2015).

    Стратифицированная рандомизация: Хотя рандомизация устраняет ex ante систематическую погрешность между экспериментальной и контрольной группами, исследователи могут выбрать стратификацию случайного распределения, чтобы гарантировать, что экспериментальная и контрольная группы имеют одинаковую долю единиц с определенными важными характеристиками. .Поскольку переменная стратификации, вероятно, будет коррелировать с переменной результата, стратификация обычно уменьшает остаточную дисперсию переменной результата, увеличивая мощность. Дополнительную информацию о стратификации см. в ресурсе рандомизации J-PAL и в Athey and Imbens (2017).

    Гетерогенные эффекты лечения: Стратификация также может быть полезна для расчета гетерогенных эффектов лечения среди определенных групп. Например, нас может заинтересовать сравнение разнородных результатов среди мужчин и женщин, среди избирателей с высшим образованием и избирателей без высшего образования и т. д.В этом случае полезно провести отдельные расчеты мощности для двух групп, чтобы убедиться, что исследование имеет достаточную мощность для обнаружения представляющих интерес гетерогенных эффектов лечения.

    Добавление ковариат: Здесь применяется та же логика, что и со стратификацией: рандомизация устраняет необходимость включения ковариат для несмещенных оценок эффекта лечения, но это может быть полезно для уменьшения остаточной дисперсии переменной результата. При прочих равных это увеличивает мощность, хотя степень этого зависит от размера набора данных и корреляции между ковариатами и переменной результата, среди других факторов. 6  См. ресурсы J-PAL по анализу данных, чтобы получить рекомендации по включению ковариат в ваш анализ, а также Athey and Imbens (2017) для получения дополнительной информации.

    Несколько групп лечения: Если дизайн исследования включает несколько групп, нас может заинтересовать попарное сравнение между группами лечения или между одной группой лечения и контролем. Убедитесь, что исследование рассчитано на наименьшую MDE среди сравнений, которые будут сделаны (хотя это может значительно увеличить затраты при сравнении двух аналогичных методов лечения).Может быть полезно сначала рассчитать MDE для каждого попарного сравнения, предполагая равные доли распределения, а затем повторно рассчитать MDE после перегруппировки выборок различными способами, чтобы понять, какие сравнения могут быть содержательно сделаны в рамках бюджетного ограничения. Обратите внимание, что если в анализе вы будете делать поправку на множественные сравнения между группами (например, контроль и лечение 1, контроль и лечение 2, лечение 1 и 2 и т. д.), вы должны сделать то же самое при расчетах мощности.

    Множественные исходы: Как и в случае множественного лечения, если исследование будет рассматривать множественные исходы, важно убедиться, что оно способно выявить все исходы, т.е.т. е. выберите размер выборки и схему, которые позволяют обнаружить наименьший MDE из интересующих результатов.

    Несколько гипотез: При оценке нескольких гипотез важно отметить, что уровень значимости или вероятность отклонения нулевой гипотезы увеличивается с увеличением количества гипотез. С этим можно справиться с помощью корректировок для проверки множественных гипотез (MHT), таких как корректировки Бонферрони или Бенджамини Хохберга. Мощность может увеличиваться или уменьшаться в зависимости от типа корректировки, количества гипотез и корреляции между нулевыми гипотезами (Портер, 2016; МакКоннелл и Вера-Эрнандес, 2015), но если вы будете делать поправку на МГТ в анализе, важно сделать это в расчеты мощности для обеспечения достаточной мощности исследования.См. ресурс анализа данных J-PAL, а также руководство по методам EGAP и McKenzie (2020) для более подробного описания проблемы, раздел 4 List, Shaikh and Xu (2016) для демонстрации нескольких корректировок гипотез с несколькими группами лечения и гетерогенными эффекты и страницы 29–30 МакКоннелла и Веры-Эрнандес (2015) для описания приложений для расчетов мощности.

    Оценка размера выборки и анализ мощности для клинических исследований

    Клинические исследования можно разделить на опросы, эксперименты, обсервационные исследования и т. д.Они должны быть тщательно спланированы для достижения цели исследования. Планирование хорошего исследования имеет много аспектов. Первый шаг – определить проблему, и она должна быть оперативной. Второй шаг заключается в определении экспериментальных единиц или единиц наблюдения, а также соответствующих испытуемых и контролей. Необходимо тщательно определить критерии включения и исключения, которые должны учитывать все возможные переменные, которые могут повлиять на наблюдения и измеряемые единицы. Дизайн исследования должен быть четким, а процедуры определены в соответствии с наилучшей доступной методологией.Основываясь на этих факторах, исследование должно иметь адекватный размер выборки по отношению к целям и возможной изменчивости исследования. Выборка должна быть «достаточно большой», чтобы эффект ожидаемой величины научной значимости также был статистически значимым. В то же время важно, чтобы выборка исследования не была «слишком большой», когда эффект, имеющий небольшое научное значение, тем не менее поддается статистическому обнаружению. Кроме того, размер выборки важен по экономическим причинам: исследование недостаточного размера может быть пустой тратой ресурсов, поскольку оно может не дать полезных результатов, в то время как исследование большого размера требует больше ресурсов, чем необходимо.В эксперименте с участием людей или животных размер выборки является критическим этическим вопросом. Поскольку плохо спланированный эксперимент подвергает испытуемых потенциально вредному лечению без расширения знаний.[1,2] Таким образом, фундаментальным шагом в разработке клинического исследования является расчет мощности и размера выборки. Мощность — это вероятность правильного отклонения нулевой гипотезы о том, что выборочные оценки (например, среднее значение, пропорция, шансы, коэффициент корреляции и т. д.) статистически не различаются между исследуемыми группами в исходной популяции. Желательны большие значения мощности, не менее 80%, желательно с учетом имеющихся ресурсов и этических соображений. Мощность пропорционально увеличивается по мере увеличения размера выборки для исследования. Соответственно, исследователь может контролировать мощность исследования, регулируя размер выборки, и наоборот.[3,4]

    Клиническое исследование будет выражено с точки зрения оценки эффекта, соответствующего доверительного интервала и значения P . Доверительный интервал указывает на вероятный диапазон значений истинного эффекта в популяции, в то время как значение P определяет, насколько вероятно, что наблюдаемый эффект в выборке является случайным.Связанная величина — это статистическая мощность; это вероятность выявления точного различия между двумя группами в исследуемых выборках, когда такое различие действительно существует в популяциях, из которых были взяты выборки.

    Дизайн исследования, исходная переменная и размер выборки

    Дизайн исследования оказывает большое влияние на размер выборки. Для описательных исследований требуются сотни испытуемых, чтобы получить приемлемый доверительный интервал для небольших эффектов. Для экспериментальных исследований обычно требуется меньшая выборка, в то время как для перекрестных планов требуется четверть требуемого количества по сравнению с контрольной группой, потому что каждый субъект подвергается экспериментальному лечению в перекрестном исследовании.Для оценочных исследований в одной группе с дизайном до и после поста требуется вдвое меньше, чем для аналогичного исследования с контрольной группой. Дизайн исследования с односторонней гипотезой требует на 20% меньше участников по сравнению с двусторонними исследованиями. Нерандомизированные исследования требуют на 20 % больше участников по сравнению с рандомизированными исследованиями, чтобы учесть смешанные факторы. Дополнительные 10–20 % субъектов необходимы для корректировки других факторов, таких как выход из исследования, недостающие данные, потеря для последующего наблюдения и т. д.

    Следует учитывать «результат», ожидаемый в ходе исследования.Возможны 3 категории результатов. Первый — это простой случай, когда существуют 2 альтернативы: да/нет, смерть/жив, вакцинирован/не вакцинирован и т. д. Вторая категория охватывает множественные взаимоисключающие альтернативы, такие как религиозные убеждения или группы крови. Для этих 2 категорий исходов данные обычно выражаются в процентах или показателях [5–7]. Третья категория охватывает непрерывные переменные ответа, такие как вес, рост, артериальное давление, оценка по ВАШ, ИЛ-6, ФНО-α, гомоцистеин и т. д., которые являются непрерывными измерениями и суммируются как средние значения и стандартные отклонения.Статистические методы подбирают размер выборки в зависимости от того, какое из этих показателей исходов имеет решающее значение для исследования, например, для оценки категориальной переменной требуется больший размер выборки по сравнению с непрерывной переменной исхода.

    Мощность

    Разница между двумя группами в исследовании будет изучаться с точки зрения оценки эффекта, соответствующего доверительного интервала и значения P . Доверительный интервал указывает на вероятный диапазон значений истинного эффекта в популяции, а значение P определяет, насколько вероятно, что наблюдаемый эффект в выборке является случайным.Связанной величиной является статистическая мощность исследования, вероятность обнаружения заранее определенной клинической значимости. Идеальным исследованием является то, которое имеет большую мощность. Это означает, что исследование имеет высокие шансы обнаружить различия между группами, если они существуют, следовательно, если исследование не демонстрирует различий между группами, исследователь может с достаточной уверенностью сделать вывод об их отсутствии. Идеальная мощность для любого исследования считается равной 80%.[8]

    В исследованиях статистическая мощность обычно рассчитывается с двумя целями.1) Его можно рассчитать до сбора данных на основе информации из предыдущих исследований, чтобы определить размер выборки, необходимый для текущего исследования. 2) Он также может быть рассчитан после анализа данных. Вторая ситуация возникает, когда результат оказывается незначимым. В этом случае статистическая мощность рассчитывается для проверки того, вызван ли незначимый результат отсутствием взаимосвязи между группами или отсутствием статистической мощности.

    Статистическая мощность положительно коррелирует с размером выборки, что означает, что с учетом уровня других факторов, а именно.альфа и минимальная обнаруживаемая разница, больший размер выборки дает большую мощность. Однако исследователям должно быть ясно, чтобы найти разницу между статистической разницей и научной разницей. Хотя больший размер выборки позволяет исследователям найти статистически значимое меньшее различие, обнаруженное различие может не иметь научного значения. Поэтому рекомендуется, чтобы исследователи имели предварительное представление о том, что, по их мнению, будет научно значимой разницей, прежде чем проводить анализ мощности и определять фактический необходимый размер выборки.Анализ мощности теперь является неотъемлемой частью наук о здоровье и поведении, и его использование неуклонно растет всякий раз, когда проводятся эмпирические исследования.

    Выход из исследования, отсутствующие данные и потери для последующего наблюдения

    Рассчитанный размер выборки — это общее количество субъектов, необходимых для окончательного анализа исследования. Есть несколько практических вопросов, которые необходимо учитывать при расчете необходимого количества предметов. Это факт, что все подходящие субъекты могут не захотеть принять участие, и может потребоваться скрининг большего числа субъектов, чем окончательное число субъектов, участвующих в исследовании.Кроме того, даже в хорошо спланированных и проведенных исследованиях бывает необычно заканчивать набором данных, полным для всех набранных испытуемых, в удобном для использования формате. Причиной может быть субъектный фактор — субъекты могут не давать или отказываться давать достоверные ответы на определенные вопросы, физические измерения могут страдать от технических проблем, а в исследованиях, включающих последующее наблюдение (например, испытания или когортные исследования), будет определенная степень истощения. Причина может быть как технической, так и процедурной, например, загрязнение, несвоевременное проведение оценки или анализа.Поэтому может возникнуть необходимость рассмотреть эти вопросы перед расчетом количества субъектов, которые должны быть привлечены к участию в исследовании, чтобы получить окончательный желаемый размер выборки.

    Пример, скажем, в исследовании требуется в общей сложности N субъектов в конце исследования, когда все данные готовы для анализа, но ожидается, что часть (q) откажется участвовать или выбывает до окончания исследования. учеба заканчивается. В этом случае необходимо набрать следующее общее количество субъектов (N 90 251 1 90 252 ), чтобы обеспечить достижение окончательного размера выборки (N): %,

    Доля подходящих субъектов, которые откажутся от участия или предоставят неадекватную информацию, будет неизвестна в начале исследования.Приблизительные оценки часто возможны с использованием информации из аналогичных исследований в сопоставимых группах населения или из соответствующего пилотного исследования. [9]

    Оценка размера выборки для определения пропорции в исследованиях типа обследования

    Общей целью исследований в области обследования является сбор данных, репрезентативных для населения. Исследователь использует информацию, полученную в ходе опроса, чтобы обобщить результаты взятой выборки на генеральную совокупность в пределах случайной ошибки. Общее правило относительно приемлемой погрешности в опросных исследованиях составляет 5–10%.Размер выборки можно оценить по следующей формуле:

    Где P — распространенность или доля интересующего исследования события, E — точность (или погрешность), с которой исследователь хочет что-то измерить. Как правило, E будет составлять 10% от P, а Z α/2 является нормальным отклонением для двусторонней альтернативной гипотезы на уровне значимости; например, для 5% уровня значимости Z α/2 равно 1,96, а для 1% уровня значимости это 2.58, как показано на . D — эффект дизайна, отражающий план выборки, используемый в исследовании типа обследования. Это 1 для простой случайной выборки и более высокие значения (обычно от 1 до 2) для других планов, таких как стратифицированная, систематическая, групповая случайная выборка и т. д., оцениваемые для компенсации отклонения от процедуры простой случайной выборки. Эффект дизайна для кластерной случайной выборки принимается равным 1,5 к 2. Для целенаправленной выборки, выборки для удобства или выборки на основе суждения D превысит 10. Чем выше D, тем больше будет размер выборки, необходимый для исследования.Простая случайная выборка вряд ли будет методом выборки в реальном поданном обследовании. Если используется другой метод выборки, такой как систематическая, стратифицированная, кластерная выборка и т. д., то, вероятно, потребуется больший размер выборки из-за «эффекта схемы»[10–12]. 50%, чтобы отразить предположение, что воздействие ожидается у 50% населения. P 50% также является консервативной оценкой; Пример: Исследователя интересует размер выборки для проведения опроса по измерению распространенности ожирения в определенном сообществе. Предыдущая литература дает оценку ожирения в 20% обследуемой популяции, и при доверительном интервале 95% или уровне значимости 5% и погрешности 10% размер выборки можно рассчитать следующим образом:

    N = (Z α/2 ) 2 P(1-P)*1 / E 2 = (1,96) 2 *0,20*(1-0,20)/(0,1*0,20) 2 = 3,8416*0,16/(0,02) 2 = 1537 для простого плана случайной выборки. Таким образом, для проведения опроса населения с целью оценки распространенности ожирения требуется размер выборки 1537 человек.Примечание-E — допустимая погрешность в данном примере; это 10% х 0,20 = 0,02.

    Чтобы найти окончательный скорректированный размер выборки, допускающий уровень неответов в 10% в приведенном выше примере, скорректированный размер выборки будет равен 1537/(1-0,10) = 1537/0,90 = 1708.

    Оценка размера выборки с помощью одного среднее по группе

    Если исследователь проводит исследование в одной группе, например, оценку результатов в группе пациентов, прошедших определенное лечение, или пациентов с определенным типом заболевания, и первичный результат представляет собой непрерывную переменную, для которой выражаются среднее значение и стандартное отклонение. результатов или оценок генеральной совокупности размер выборки можно оценить по следующей формуле: полученные из предыдущего исследования или экспериментального исследования, а d — точность оценки или насколько она близка к истинному среднему значению.Z α/2 — нормальное отклонение для двусторонней альтернативной гипотезы на уровне значимости.

    Научные исследования с одной хвостовой гипотезой, приведенная выше формула может быть переписана как % и 1% уровень значимости.

    Пример: В исследовании по оценке веса населения и требуется, чтобы ошибка оценки была менее 2 кг от истинного среднего (т. е. ожидаемая разница в весе составляет 2 кг), стандартное вероятность 95 %, и (то есть) при частоте ошибок 5 % размер выборки оценивается как N = (1.96) 2 (5) 2 / 2 2 дает выборку из 24 испытуемых, если принять поправку 10% на пропущенные, потери на катамнез, изъятия, то скорректированная выборка составит 27 испытуемых . Полученный таким образом скорректированный размер выборки составляет 24/(1,0-0,10) ≅ 24/0,9 = 27, а для 20% поправок скорректированный размер выборки будет равен 30.

    Оценка размера выборки с использованием двух средних

    ; Нулевая гипотеза H o : m 1 = m 2 vs.альтернативная гипотеза H a : m 1 = m 2 + d где d — разница между двумя средними значениями, а n1 и n2 — размер выборки для группы I и группы II, такой, что N = n1 + n2. Отношение r = n1/n2 учитывается всякий раз, когда исследователю требуется неравный размер выборки по различным причинам, таким как этика, стоимость, доступность и т. д.

    Тогда общий размер выборки для исследования будет следующим: α — нормальное отклонение на уровне значимости (Z α равно 1.96 для 5% уровня значимости и 2,58 для 1% уровня значимости), а Z 1-β – нормальное отклонение при мощности 1-β% с ошибкой типа II β% (0,84 при мощности 80% и 1,28 при 90°). % статистической мощности). r = n1/n2 — это соотношение размера выборки, необходимого для 2 групп, обычно оно используется для сохранения одинакового размера выборки для 2 групп. Если r = 0,5, распределение размера выборки составляет 1:2 для 2 групп. σ и d — объединенное стандартное отклонение и разница средних значений двух групп. Эти значения получены либо из предыдущих исследований аналогичной гипотезы, либо из проведения пилотного исследования.Допустим, исследователь-клиницист хочет сравнить влияние двух препаратов, А и В, на систолическое артериальное давление (САД). При поиске в литературе исследователь обнаружил, что среднее значение САД в 2 группах составляло 120 и 132, а общее стандартное отклонение — 15. Общий размер выборки для исследования с r = 1 (равный размер выборки), a = 5% и мощность 80% и 90 % были рассчитаны как и для 90 % статистической мощности, размер выборки будет равен 32. При неравном размере выборки 1:2 ( r = 0,5) с 90-процентной статистической мощностью 90 % при уровне значимости 5 % общий размер выборки, необходимый для исследования, составляет 48 человек.

    Оценка размера выборки с использованием двух пропорций

    В исследовании, основанном на пропорциях исхода события в двух популяциях (группах), таких как процент осложнений, улучшение смертности, осведомленность, хирургический или медицинский результат и т. д., оценка размера выборки основана на на пропорции результатов, которые получены из предыдущего обзора литературы или проведения пилотного исследования на меньшем размере выборки. Исследование с нулевой гипотезой H o : π 1 = π 2 vs. H a : π 1 = π 2 + d , где π — доля населения, а p1 и p2 — соответствующие оценки выборки, размер выборки можно оценить по следующей формуле

    Где p1 и p2 — доля интересующего события (исхода) для группы I и группы II, а p — Z α/2 — нормальное отклонение на уровне значимости, а Z 1-β — нормальное отклоняются на 1-β% мощности с β% ошибки типа II, обычно считается, что ошибка типа II составляет 20% или меньше.

    Если исследователь планирует провести исследование с неравными группами, он или она должны рассчитать N, как если бы мы использовали равные группы, а затем рассчитать модифицированный размер выборки. Если r = n1/n2 — отношение объема выборки в 2 группах, то искомый объем выборки равен N 1 = N (1+ r ) 2 /4 r , если n1 = 2n2, то есть соотношение размера выборки составляет 2:1 для группы 1 и группы 2, тогда N 1 = 9 N /8, довольно небольшое увеличение общего размера выборки.

    Пример: считается, что доля пациентов, у которых развиваются осложнения после операции одного типа, составляет 5%, а доля пациентов, у которых развиваются осложнения после операции второго типа, составляет 15%. Насколько велика должна быть выборка в каждой из 2 групп пациентов, если исследователь хочет определить с мощностью 90 %, имеет ли вторая процедура уровень осложнений значительно выше, чем первая, при 5 % уровне значимости?

    в примере,

  • A)

    A)

    Тестовая ценность различий в Уровень осложнения 0%

  • B)

    Отрежимое количество осложнений 5%, 15% в 2 группах

  • C)

    Уровень значимости 5%

  • d)

    D)

    мощность теста 90%

  • E)

    альтернативная гипотеза (одна хвостана) (P 1 -P 2 ) <0%

  • Общий требуемый размер выборки составляет 74 для равного распределения размера, для неравного распределения размера выборки с 1. 5:1, то есть r = 1,5, общий размер выборки составит 77, из них 46 для группы I и 31 для группы II.

    Оценка размера выборки с коэффициентом корреляции

    В обсервационных исследованиях, которые включают оценку корреляции (r) между двумя представляющими интерес переменными, скажем, X и Y, типичная гипотеза формы H 0 : r = 0 против H a :r ≠ 0, размер выборки для исследования корреляции может быть получен путем вычисления

    , где Z α/2 и Z 1-β являются нормальными отклонениями для ошибки I рода (уровень значимости) и мощности исследования [Таблицы и ].

    Пример. Согласно литературным данным, корреляция между потреблением соли и систолическим артериальным давлением составляет около 0,30. Исследование проводится для подтверждения этой корреляции в популяции с уровнем значимости 1% и мощностью 90%. Размер выборки для такого исследования можно оценить следующим образом:

    размер выборки для 90% мощности при 1% уровне значимости составил 99 для двустороннего альтернативного теста и 87 для одностороннего теста.

    Оценка размера выборки с отношением шансов

    В исследовании случай-контроль данные обычно обобщаются по отношению шансов, а не по разнице между двумя пропорциями, когда интересующие переменные результата были категориальными по своей природе.Если P1 и P2 представляют собой доли случаев и контролей, соответственно, подверженных воздействию фактора риска, тогда:

    если мы знаем распространенность воздействия в общей популяции (P), то общий размер выборки N для оценки ОШ составляет где Z α/2 и Z 1-β являются нормальными отклонениями для ошибки I рода (уровень значимости) и мощности исследования [таблицы и ].

    Пример: Распространенность переломов позвонков в популяции составляет 25%. Когда исследование заинтересовано в оценке влияния курения на перелом, с отношением шансов 2, при уровне значимости 5% (односторонний тест) и мощности 80%, общий размер выборки для исследования равен размер выборки можно оценить по:

    Frontiers | Расчет и отчетность о размерах эффекта для облегчения кумулятивной науки: практическое руководство по t-тестам и ANOVA

    Величина эффекта — наиболее важный результат эмпирических исследований. Исследователи хотят знать, имеет ли вмешательство или экспериментальная манипуляция эффект больше нуля, или (когда эффект очевиден) насколько велик этот эффект. Исследователям часто напоминают сообщать о размерах эффекта, потому что они полезны по трем причинам. Во-первых, они позволяют исследователям представить величину сообщаемых эффектов в стандартизированной метрике, которую можно понять независимо от шкалы, которая использовалась для измерения зависимой переменной. Такие стандартизированные размеры эффекта позволяют исследователям сообщать о практической значимости своих результатов (каковы практические последствия результатов для повседневной жизни), а не только сообщать о статистической значимости (насколько правдоподобна картина результатов, наблюдаемых в эксперименте, с учетом предположение об отсутствии эффекта в популяции).Во-вторых, величина эффекта позволяет исследователям делать метааналитические выводы, сравнивая стандартизированную величину эффекта в разных исследованиях. В-третьих, размеры эффекта из предыдущих исследований можно использовать при планировании нового исследования. Априорный анализ мощности может дать представление о среднем размере выборки, необходимом исследованию для получения статистически значимого результата с желаемой вероятностью.

    Цель этой статьи — объяснить, как рассчитывать и сообщать о размерах эффекта для различий между средними значениями между планами и планами внутри субъектов таким образом, чтобы представленные результаты способствовали накоплению научных данных.Есть некоторые основания полагать, что многие исследователи могут улучшить свое понимание величины эффекта. Например, исследователи в основном сообщают о парциальном эта-квадрате размера эффекта (η 2 p ), который предоставляется пакетами статистического программного обеспечения, такими как SPSS. Тот факт, что η 2 p часто приводится для однофакторного дисперсионного анализа (где частичный эта в квадрате равен эта в квадрате), указывает на то, что исследователи либо очень увлечены ненужными подстрочными буквами, либо слишком полагаются на величины эффекта. поскольку они предоставляются пакетами статистического программного обеспечения.

    Этот практический учебник следует рассматривать как дополнительный ресурс для психологов, которые хотят больше узнать о величине эффекта (прекрасные книги, в которых эта тема обсуждается более подробно, см. в Cohen, 1988; Maxwell and Delaney, 2004; Grissom and Kim, 2005; Thompson, 2006; Aberson, 2010; Ellis, 2010; Cumming, 2012; Murphy et al., 2012). Для облегчения расчета величины эффекта предоставляется дополнительная таблица. Сообщение о стандартизованных размерах эффекта для средних различий требует, чтобы исследователи сделали выбор в отношении стандартизатора среднего различия или выбора в отношении того, как рассчитать долю дисперсии, объясняемую эффектом.В этой статье эти варианты выбора будут освещены для d Коэна и эта-квадрата (η 2 ), двух наиболее широко используемых величин эффекта в психологических исследованиях, с особым акцентом на различия между планами внутри и между субъектами. . Я указываю на некоторые предостережения для исследователей, которые хотят выполнить анализ мощности для внутрисубъектных планов, и даю рекомендации относительно размеров эффекта, о которых следует сообщать.

    Информация об ожидаемом размере эффекта является важной информацией при планировании исследования.Исследователи обычно полагаются на тесты значимости нулевой гипотезы, чтобы сделать выводы о наблюдаемых различиях между группами наблюдений. Вероятность правильного отклонения нулевой гипотезы известна как степень статистического теста (Cohen, 1988). Статистическая мощность зависит от размера выборки исследования (благодаря его влиянию на достоверность значений выборки и, в частности, от степени, в которой можно ожидать, что значения выборки будут аппроксимацией значений генеральной совокупности), размера эффекта и критерий значимости (обычно α = 0.05). Если известны (или оценены) три параметра, можно рассчитать четвертый параметр. В априорном анализе мощности исследователи рассчитывают размер выборки, необходимый для наблюдения эффекта определенного размера, с заранее определенным критерием значимости и желаемой статистической мощностью.

    Общепринятый минимальный уровень мощности равен 0,80 (Cohen, 1988). Этот минимум основан на идее, что при критерии значимости 0,05 отношение ошибки типа 2 (степень 1) к ошибке типа 1 составляет 0,20/0,05, поэтому заключение, что 90 856 равно 90 857 эффекту, когда 90 856 нет Эффект в популяции считается в четыре раза более серьезным, чем заключение о том, что нет эффекта , когда есть эффект в популяции.Однако некоторые исследователи утверждают, что ошибки типа 2 потенциально могут иметь гораздо более серьезные последствия, чем ошибки типа 1 (Fiedler et al., 2012). Таким образом, хотя рекомендуемым минимумом является мощность 0,80, более желательна более высокая мощность (например, 0,95), если это практически осуществимо. Оценки размера эффекта имеют свои собственные доверительные интервалы [для расчетов для d Коэна см. Cumming (2012), для F -тестов см. Smithson (2001)], которые в экспериментальной психологии часто бывают очень большими.Таким образом, исследователи должны понимать, что доверительный интервал вокруг оценки размера выборки, полученной на основе анализа мощности, часто также очень велик и может не обеспечивать очень точную основу для определения размера выборки в будущем исследовании. Мета-анализ может обеспечить более точную оценку размера эффекта для анализа мощности, а правильное сообщение оценок размера эффекта может облегчить будущие мета-анализы [хотя из-за предвзятости публикаций мета-анализы могут по-прежнему завышать истинный размер эффекта, см. Brand et al.(2008 г.); Баккер и др. (2012)].

    Статистическая значимость и обобщаемость оценок величины эффекта

    Рассмотрим два набора наблюдений с M 1 = 7,7, SD 1 = 0,95 и M 2 = 8,7, SD

    7 2. В зависимости от того, были ли данные собраны в планах между субъектами или внутри субъектов, частичный эта квадрат размера эффекта (η 2 p ) для разницы между этими двумя наблюдениями (подробности см. в иллюстративном примере ниже) либо 0.26 или 0,71 соответственно. Учитывая, что средняя разница одинакова (т. е. 1) независимо от дизайна, какая из этих двух величин эффекта является «истинной» величиной эффекта? На этот вопрос есть два разных ответа. Одна точка зрения фокусируется на обобщаемости оценки размера эффекта для разных планов, а другая точка зрения фокусируется на статистической значимости различий между средними значениями. Я кратко остановлюсь на этих двух точках зрения.

    Как замечают Максвелл и Делани (2004, стр. 548): «главная цель разработки показателей размера эффекта — предоставить стандартную метрику, которую метааналитики и другие специалисты смогут интерпретировать в исследованиях, различающихся по своим зависимым переменным, а также типам конструкции.Эта первая точка зрения, которую я буду называть обобщенной оценкой размера эффекта , предполагает, что не имеет значения, используете ли вы внутрисубъектный план или план между субъектами. Хотя вы можете исключить индивидуальную вариацию в статистическом тесте, если используете предварительные и последующие измерения, и статистическая мощность теста часто существенно возрастает, размер эффекта (например, η 2 p ) должен не различаются в зависимости от используемого дизайна. Поэтому многие исследователи рассматривают величину эффекта в планах внутри субъектов как завышенную оценку «истинной» величины эффекта (например, Dunlap et al., 1996; Olejnik and Algina, 2003; Maxwell and Delaney, 2004).

    Вторая точка зрения, которую я буду называть статистической значимостью точки зрения, фокусируется на статистической проверке предсказанного эффекта и рассматривает индивидуальные различия как нерелевантные для рассматриваемой гипотезы. Цель состоит в том, чтобы обеспечить статистическую поддержку гипотезы, а способность различать дисперсию, вызванную индивидуальными различиями, и дисперсию, вызванную манипуляциями, увеличивает мощность исследования.Исследователи, отстаивающие точку зрения статистической значимости, рассматривают различные размеры эффекта (например, η 90 251 2 90 252 90 277 90 856 p 90 857 90 278) в планах внутри и между субъектами как преимущество более мощного плана. Акцент на результатах статистического теста с этой точки зрения можно проиллюстрировать с помощью доверительных интервалов. Как впервые обсуждалось Лофтусом и Массоном (1994), использование традиционных формул для доверительных интервалов (разработанных для планов между субъектами) может привести к заметному расхождению между статистической сводкой результатов и планками погрешностей, используемыми для визуализации различий между наблюдения.Чтобы устранить это несоответствие, Лофтус и Массон (1994, стр. 481) предполагают, что: «Учитывая нерелевантность межсубъектной дисперсии во внутрисубъектном плане, ее можно законно игнорировать для целей статистического анализа».

    Подводя итог, можно сказать, что исследователи либо сосредотачиваются на обобщенных оценках величины эффекта и пытаются разработать показатели величины эффекта, которые не зависят от плана исследования, либо исследователи сосредотачиваются на статистической значимости и предпочитают величины эффекта (и доверительные интервалы), чтобы отражать сделанные выводы. по статистическому тесту.Хотя эти две точки зрения не исключают друг друга, они определяют некоторые практические решения, которые делают исследователи, сообщая о своих результатах. Независимо от того, сосредоточены ли исследователи на статистической значимости или обобщаемости измерений, кумулятивная наука выиграет, если исследователи определят размер своей выборки априори и сообщат о размерах эффекта, когда они будут делиться своими результатами. В следующих разделах я расскажу, как рассчитываются величины эффекта для описания различий между средними значениями, уделяя особое внимание сходствам и различиям в планах внутри и между субъектами, а затем приведу иллюстративный пример.

    Различия и сходства между размерами эффектов

    Как сказал Пуанкаре (1952, стр. 34): «математика — это искусство давать одно и то же имя разным вещам». К сожалению, в области расчета величины эффекта статистики потерпели неудачу у Пуанкаре. Величины эффектов имеют либо разные имена, хотя в основном они представляют собой одну и ту же сущность (например, ссылка на r 2 как η 2 ), либо они получили одно и то же имя, несмотря на то, что рассчитываются по-разному (например, относятся к размер эффекта как d Коэна, независимо от способа его расчета). Величину эффекта можно разделить на две группы (Rosenthal, 1994): семейство d (состоящее из стандартизированных разностей средних) и семейство r (показатели силы ассоциации). Концептуально размеры эффекта семейства d основаны на разнице между наблюдениями, деленной на стандартное отклонение этих наблюдений. Величина семейного эффекта r описывает пропорцию дисперсии, которая объясняется принадлежностью к группе [например, корреляция ( r ) равна 0.5 указывает на 25% ( r 2 ) дисперсии, что объясняется разницей между группами]. Эти величины эффекта рассчитываются из суммы квадратов (разница между отдельными наблюдениями и средним значением для группы, возведенная в квадрат и суммированная) для эффекта, деленная на суммы квадратов для других факторов в плане.

    Еще одно различие между величинами эффекта заключается в том, корректируют ли они предвзятость или нет (например, Thompson, 2007). Величина эффекта популяции почти всегда оценивается на основе выборок, и все оценки размера эффекта популяции, основанные на средних значениях выборки, завышают истинный эффект популяции (более подробное объяснение см. в Thompson, 2006).Поэтому используются поправки на систематическую ошибку (хотя эти поправки не всегда приводят к полностью несмещенной оценке размера эффекта). В семействе величин эффекта d поправка для d Коэна известна как g Хеджеса, а в семействе величин эффекта r известна поправка на эта-квадрат (η 2 ). как омега в квадрате (ω 2 ). Эти размеры эффектов будут обсуждаться более подробно в следующих параграфах.

    Дизайн Коэна между предметами

    Коэффициент Коэна d используется для описания стандартизированной средней разности эффекта.Это значение можно использовать для сравнения эффектов в разных исследованиях, даже если зависимые переменные измеряются по-разному, например, когда в одном исследовании для измерения зависимых переменных используется 7-балльная шкала, а в другом — 9-балльная шкала, или даже когда используются совершенно разные меры, например, когда в одном исследовании используются меры самооценки, а в другом исследовании используются физиологические измерения. Он варьируется от 0 до бесконечности. Коэн (1988) использует нижние индексы, чтобы различать разные версии коэновского d , и я буду следовать этой практике, потому что она предотвращает путаницу (без какого-либо нижнего индекса Коэновский d обозначает все семейство величин эффекта).Коэн называет стандартизированную среднюю разницу между двумя группами независимых наблюдений для выборки как d s , которая определяется как:

    ds=X¯1−X¯2(n1−1)SD12+(n2−1)SD22n1+n2−2(1)

    В этой формуле числитель представляет собой разницу между средними значениями двух групп наблюдений. Знаменатель представляет собой объединенное стандартное отклонение. Помните, что стандартное отклонение рассчитывается на основе различий между каждым отдельным наблюдением и средним значением для группы.Эти разности возводятся в квадрат, чтобы положительные и отрицательные значения не компенсировали друг друга, и суммируются (также называемая суммой квадратов ). Это значение делится на количество наблюдений минус один, что представляет собой поправку Бесселя на систематическую ошибку при оценке дисперсии генеральной совокупности, и, наконец, извлекается квадратный корень. Эта поправка на погрешность в выборочной оценке дисперсии населения основана на оценке методом наименьших квадратов (см. McGrath and Meyer, 2006).Обратите внимание, что d s Коэна иногда называют g Коэна, что может сбивать с толку. Коэффициент Коэна d s для планов между субъектами напрямую связан с тестом t и может быть рассчитан по формуле:

    Если известен только общий размер выборки, ds Коэна≈2×t/N. Статистическая значимость обычно выражается в терминах высоты 90 856 t 90 857 -значений для конкретных размеров выборки (но также может быть выражена в терминах того, включает ли 95% доверительный интервал вокруг 90 856 d 90 277 s 90 278 90 857 Коэна 0 или нет), тогда как d s Коэна обычно используется в априорном анализе мощности для планов между субъектами (хотя анализ мощности также может быть основан на значении t и n для каждого условия). Формула 2 подчеркивает прямую связь между величиной эффекта и статистической значимостью.

    Стандартизированная средняя разность также может быть рассчитана без поправки Бесселя, и в этом случае она обеспечивает оценку максимального правдоподобия для выборки, как отметили Хеджес и Олкин (1985). Разница между Коэном D S 9 S 9 S 9 9 D D POP POP (для населения) важно иметь в виду приверженные привержению Cohen D S до точки Byeralation R pb (далее в тексте он будет называться просто r ).Во многих учебниках приводится формула для преобразования d pop Коэна в r , в то время как формула для преобразования d s Коэна в r (которую можно использовать только для планов между субъектами) предоставляется МакГрат и Мейер (2006):

    Как упоминалось ранее, формула Коэна для d s , основанная на выборочных средних, дает смещенную оценку размера эффекта совокупности (Hedges and Olkin, 1985), особенно для небольших выборок ( n < 20). .Поэтому Коэна d s иногда называют нескорректированным размером эффекта . Скорректированный размер эффекта , или g Хеджеса (который является беспристрастным, см. Cumming, 2012), составляет:

    Хеджеса gs=Коэна ds×(1−34(n1+n2)−9)(4)

    Я использую один и тот же нижний индекс в g Хеджеса, чтобы различать различные вычисления d Коэна. Хотя разница между g s Хеджеса и d s Хеджеса очень мала, особенно при размерах выборки более 20 (Kline, 2004), предпочтительнее (и так же просто) указать g Хеджеса. с .Существуют также процедуры начальной загрузки для расчета d s Коэна, когда данные не распределены нормально, что может обеспечить менее смещенную точечную оценку (Kelley, 2005). Пока исследователи сообщают количество участников в каждом состоянии для сравнения между субъектами и значение t , можно рассчитать d Коэна и g Хеджеса. Всякий раз, когда стандартные отклонения существенно различаются между условиями, следует сообщать Δ Гласса (см. ниже).

    Интерпретация Коэна

    d

    Как исследователи должны интерпретировать этот размер эффекта? Обычно используемая интерпретация заключается в том, чтобы обозначать величину эффекта как малую (90 856 d 90 857 = 0,2), среднюю (90 856 d 90 857 = 0,5) и большую (90 856 d 90 857 = 0,8) на основе ориентиров, предложенных Cohen (1988). Однако эти значения произвольны и не должны интерпретироваться жестко (Thompson, 2007). Небольшие размеры эффекта могут иметь большие последствия, такие как вмешательство, которое приводит к надежному снижению уровня самоубийств с величиной эффекта d = 0.1. Единственная причина для использования этих контрольных показателей заключается в том, что результаты являются чрезвычайно новыми и их нельзя сравнивать с аналогичными данными, опубликованными в литературе (Cohen, 1988). d Коэна в планах между субъектами можно легко интерпретировать как процент от стандартного отклонения, так что d Коэна, равное 0,5, означает, что разница равна половине стандартного отклонения. Однако лучший способ интерпретировать d Коэна — связать его с другими эффектами, описанными в литературе, и, если возможно, объяснить практические последствия этого эффекта.К сожалению, нет четких рекомендаций, как это сделать (Fidler, 2002).

    Интересную, хотя и нечасто используемую интерпретацию различий между группами может дать размер общеязыкового эффекта (McGraw and Wong, 1992), также известный как вероятность превосходства (Grissom and Kim, 2005), который равен более интуитивно понятная статистика, чем d Коэна или r . Он может быть рассчитан непосредственно из d Коэна, преобразует величину эффекта в проценты и выражает вероятность того, что случайно выбранный человек из одной группы будет иметь более высокое наблюдаемое измерение, чем случайно выбранный человек из другой группы (для между планами). ) или (для внутренних планов) вероятность того, что индивидуум имеет более высокую ценность по одному измерению, чем по другому.Он основан на распределении оценок различий со средним значением, которое оценивается на основе средних различий между выборками, и стандартным отклонением, которое представляет собой квадратный корень из суммы выборочных дисперсий, деленный на два. Математически размер общеязыкового эффекта представляет собой вероятность того, что Z-оценка будет больше значения, которое соответствует разнице между группами, равной 0, на кривой нормального распределения. Z можно рассчитать по:

    , после чего размер общеязыкового эффекта представляет собой процент, связанный с вероятностью верхнего хвоста этого значения.Дополнительная электронная таблица обеспечивает простой способ расчета размера общеязыкового эффекта.

    Cohen’s

    d в сравнении одной выборки или коррелированных выборок

    Концептуально вычисление d Коэна для коррелированных измерений аналогично вычислению d Коэна для независимых групп, где различия между двумя измерениями делятся на стандартное отклонение обеих групп измерений. Однако в случае коррелированных измерений зависимый t -критерий использует стандартное отклонение разностных показателей.Проверка того, значительно ли наблюдения двух коррелированных измерений отличаются друг от друга с использованием парных выборок t -критерия, математически идентична проверке того, значительно ли показатели разности коррелированных измерений отличаются от 0 с использованием одновыборочного t t -теста. . Точно так же расчет величины эффекта для разницы между двумя коррелированными измерениями подобен величине эффекта, рассчитанной для одного образца t -теста.Стандартизированная величина эффекта средней разности для планов внутри субъектов обозначается как Cohen’s d z , где Z указывает на тот факт, что единицей анализа являются уже не X или Y, а их разность, Z, и может быть рассчитано с:

    Коэна dz=Mdiff∑(Xdiff−Mdiff)2N−1(6)

    , где числитель — это разница между средним значением ( M ) оценок различий и значением сравнения μ (например, 0), а знаменатель — это стандартное отклонение оценок различий ( S diff ).Оценка размера эффекта Коэна d z также может быть рассчитана непосредственно из значения t и количества участников с использованием формулы, предложенной Розенталем (1991):

    Учитывая прямую зависимость между t -значением парных выборок t -критерия и d z Коэна, неудивительно, что программное обеспечение, выполняющее анализ мощности для планов внутри субъектов (например, G*Power (Faul et al., 2009)) опирается на d z Коэна в качестве входных данных.Поэтому, чтобы позволить исследователям выполнить априорный анализ мощности, достаточно указать t -значение и количество пар наблюдений (или степеней свободы, n – 1). d z Коэна редко используется в мета-анализах, потому что исследователи часто хотят иметь возможность сравнивать эффекты внутри и между субъектами. Одним из решений (которое обычно не рекомендуется) является использование Коэна d rm , где нижний индекс используется Моррисом и ДеШоном (2002), чтобы указать, что это эквивалент Коэна d для повторных измерений .Коэна d rm контролирует корреляцию между двумя наборами измерений, как объяснено ниже.

    Альтернативная формула для расчета стандартного отклонения оценок различий от стандартных отклонений обеих групп и их корреляции дана Cohen (1988) как:

    Sdiff=SD12+SD22−2×r×SD1×SD2(8)

    , где r — корреляция между показателями, а S — стандартное отклонение в каждом из двух наборов наблюдений.По мере увеличения корреляции между показателями стандартное отклонение оценок разницы уменьшается. В экспериментальной психологии корреляции между показателями обычно имеют положительное ненулевое значение. Это имеет два последствия. Во-первых, планы внутри субъектов обычно имеют большую статистическую мощность, чем планы между субъектами, потому что стандартное отклонение показателей различий меньше, чем стандартные отклонения двух групп наблюдений. Во-вторых, при допущении равных дисперсий (для неравных дисперсий следует рассчитать Δ Гласса, см. ниже) средняя стандартизированная разница между двумя коррелированными измерениями нормируется на значение, которое на 2 (1 − r) больше, чем стандартное отклонение. для независимых наблюдений (см. Cohen, 1988), и таким образом:

    drm Коэна = MdiffSD12+SD22−2×r×SD1×SD2×2(1−r)(9)

    Когда r = 0.5, и стандартные отклонения в обеих группах измерений одинаковы, d s Коэна из плана между субъектами и d rm Коэна из плана внутри субъектов идентичны, но различия в стандартных отклонениях между двумя группами будут вносить различия между двумя размерами эффекта, которые становятся более выраженными, когда r приближается к 0 или 1.

    Другим решением для расчета d Коэна для планов внутри субъектов является простое использование стандартного отклонения обоих повторных измерений в качестве стандартизатора (которое игнорирует корреляцию между измерениями).Камминг (2012) называет этот подход Коэном d av , что означает просто:

    Коэнов dav=MdiffSD1+SD22(10)

    Когда стандартные отклонения обеих групп наблюдений равны, Коэна d av и Коэна d rm идентичны, а величина эффекта равна Коэну d s для тех же стандартных средних значений. отклонения в межпредметном дизайне. В целом d av Коэна будет больше похоже на d s Коэна (по сравнению с d rm Коэна), за исключением случаев, когда корреляции между мерами низкие, а разница между стандартными отклонениями большой.Коэновская d rm всегда более консервативна, но с высокими корреляциями между наблюдениями, иногда неоправданно консервативными.

    , когда R больше 0,5, D Z Z будет больше, чем D RM 9 RM 9 AV 9 AV , а когда R меньше 0,5, Коэн D z будет меньше, чем d rm Коэна и d av Коэна (Morris and DeShon, 2002).Данлэп и др. (1996) возражают против сообщения Коэна d z , основываясь на идее, что корреляция между показателями не меняет размер эффекта, а просто делает его более заметным за счет уменьшения стандартной ошибки, и поэтому ссылаются на d Коэна. z как завышение размера эффекта. Хотя d z Коэна редко упоминается как размер эффекта, есть некоторые ситуации, когда я считаю, что это вполне оправдано (см. Общее обсуждение).Однако в целом я бы рекомендовал сообщать о размерах эффекта, которые нельзя рассчитать на основе другой информации в статье и которые широко используются, чтобы большинство читателей могли их понять. Поскольку d z Коэна может быть рассчитано из t -значения и n и обычно не используется, моя общая рекомендация состоит в том, чтобы сообщать Коэна d rm или Коэна 7 .

    Поскольку d rm Коэна и d av Коэна основаны на выборочных оценках, и они имеют положительное смещение, мы должны применить поправку Хеджеса.Однако, в отличие от g s Хеджеса, g av Хеджеса g rm Хеджеса не являются полностью беспристрастными (Cumming, 2012). После ввода необходимой информации в дополнительную электронную таблицу он рекомендует либо g av Хеджеса, либо g rm Хеджеса, исходя из того, какое из этих двух значений больше всего похоже на d s Коэна среди испытуемых. дизайн (в соответствии с целью сообщить об оценке размера эффекта, которая сопоставима внутри и между дизайнами участников).

    В некоторых планах есть веские основания полагать, что манипуляция повлияла не только на среднее между наблюдениями, но и на стандартное отклонение. Например, предварительные и последующие измерения в исследовании, посвященном вмешательству, могут отличаться по своему стандартному отклонению в результате вмешательства. В таких конструкциях Glass et al. (1981) рекомендует использовать либо стандартное отклонение предварительного измерения в качестве стандартизатора (часто рекомендуется и используется в дополнительной электронной таблице), либо стандартное отклонение постизмерения.Это называется Δ Гласса (и можно использовать нижние индексы, чтобы указать, использовалось ли стандартное отклонение до или после измерения). Эти параметры подчеркивают важность указания того, какая версия размера эффекта d рассчитывается, а использование букв нижнего индекса может быть эффективным способом сообщить о сделанном выборе. Исследователи должны выбрать, какая величина эффекта лучше всего отражает интересующий их эффект. В таблице 1 приведены сведения об использовании различных версий показателей величины эффекта в семействе d .В дополнение к Cohen’s d можно сообщить размер эффекта общего языка, чтобы облегчить интерпретацию размера эффекта.

    Таблица 1. Краткая информация о размерах эффекта семейства d, стандартизаторах и рекомендуемом применении .

    Эта-квадрат между сравнениями и сравнениями внутри субъектов

    Эта в квадрате η 2 (часть семейства величин эффекта r и расширение r 2 , которое можно использовать для более чем двух наборов наблюдений) измеряет пропорцию вариации Y, которая связано с принадлежностью к различным группам, определяемым X, или суммой квадратов эффекта, деленной на общую сумму квадратов:

    An η 2 из 0.13 означает, что 13% общей дисперсии может быть объяснено принадлежностью к группе. Хотя η 2 является эффективным способом сравнения размеров эффектов в рамках исследования (учитывая, что каждый эффект интерпретируется по отношению к общей дисперсии, все η 2 из одного исследования в сумме составляют 100%), эта в квадрате 90 856 между 90 857 исследованиями нелегко сравнить, потому что общая вариабельность в исследовании (90 856 SS 90 857 90 277 всего 90 278) зависит от дизайна исследования и увеличивается при манипулировании дополнительными переменными.Keppel (1991) рекомендовал частичный эта-квадрат (η 2 p ) для улучшения сопоставимости величин эффекта между исследованиями, который выражает сумму квадратов эффекта по отношению к сумме квадратов эффекта и сумма квадратов ошибки, связанной с эффектом. Частичный эта квадрат рассчитывается как:

    ηp2=SSэффектSSэффект+SSошибка(12)

    Для планов с фиксированными факторами (манипулируемыми факторами или факторами, которые исчерпывают все уровни независимой переменной, такие как живые и мертвые).мертвых), но , а не для планов с измеренными факторами или ковариатами, частичный эта-квадрат можно вычислить из F -значения и его степеней свободы (например, Cohen, 1965):

    ηp2=F×dэффектF×dэффект+dферрор(13)

    Например, для F (1, 38) = 7,21, η 2 p = 7,21 × 1/(7,21 × 1 + 38) = 0,16. Эта взаимосвязь между η 2 p и F иллюстрирует, как η 2 p можно использовать в анализе мощности для оценки желаемого размера выборки для будущего эксперимента, а программные продукты, такие как G *По этой причине для питания требуется η 2 p .Если исследователи хотят облегчить анализ мощности, они должны сообщать η 2 p , особенно для планов, в которых манипулируют не всеми факторами.

    Пользователи G*Power должны знать, что значение по умолчанию η 2 p для внутренних конструкций, используемое G*Power, не соответствует значению η 2 p , предоставленному SPSS. При использовании η 2 p , предоставляемого SPSS для выполнения расчетов мощности в G*Power, нельзя просто использовать настройки программы по умолчанию.Там, где SPSS предоставляет η 2 p , которое уже включает корреляцию между парными показателями (отсюда разница в η 2 p для тех же двух средних и стандартных отклонений в зависимости от того, получены ли они из между субъектами или внутрисубъектными планами), G*Power определяет η 2 p для внутрисубъектных планов точно так же, как и для межсубъектных планов (и включает корреляции между зависимыми показателями во время расчетов мощности) .Более формальное описание этих различий, а также объяснение того, как преобразовать SPSS η 2 p в G*Power η 2 p , приведены в Приложении. Самая последняя версия G*Power (3.1) позволяет исследователям указать, что они напрямую используют SPSS η 2 p в своих расчетах, выбрав переключатель в меню параметров. Этот параметр не используется по умолчанию, и вполне вероятно, что исследователи вычислят неверную оценку выборки, если не будут знать о разнице между SPSS η 2 p и G*Power η 2 p .Когда в оставшейся части этого документа используется η 2 p , имеется в виду эквивалент SPSS, который включает корреляцию между зависимыми показателями.

    Хотя η 2 p более полезен, когда целью является сравнение величины эффекта в разных исследованиях, он не идеален, поскольку η 2 p отличается при сравнении одних и тех же двух средних значений в внутрисубъектный план или межсубъектный план. При внутрисубъектном дисперсионном анализе сумма квадратов ошибок может быть рассчитана вокруг среднего значения каждого измерения, но также и вокруг среднего значения каждого человека, когда измерения усредняются по людям.Это позволяет исследователям отличать изменчивость, обусловленную индивидуальными различиями, от изменчивости, обусловленной эффектом, при внутрисубъектном плане, тогда как такая дифференциация невозможна при межсубъектном плане. Как следствие, всякий раз, когда две группы наблюдений имеют положительную корреляцию, η 2 p будет больше в плане внутри субъектов, чем в плане между субъектами. Это также является причиной того, что дисперсионный анализ внутри субъектов обычно имеет более высокую статистическую мощность, чем дисперсионный анализ между субъектами.

    Олейник и Альгина (2003) приводят дополнительные причины, по которым η 2 p можно использовать только для сравнения эффектов между исследованиями с аналогичным экспериментальным планом. Различия во включении ковариат или блокирующих факторов между экспериментальными планами (например, включение пола участников анализа в качестве фактора между субъектами, который будет учитывать некоторую дисперсию) могут влиять на размер η 2 р .Они предлагают обобщенный эта-квадрат (η 2 G ), который исключает вариацию от других факторов из расчета величины эффекта (чтобы сделать величину эффекта сравнимой с планами, в которых эти факторы не манипулировались), но включает дисперсию из-за к индивидуальным различиям (чтобы сделать размер эффекта сопоставимым с планами между субъектами, где эта индивидуальная дисперсия не может контролироваться). При манипулировании всеми факторами между участниками η 2 G и η 2 p идентичны.В других экспериментальных планах η 2 G можно рассчитать на основе результатов дисперсионного анализа, а дополнительная электронная таблица позволяет исследователям легко рассчитать η 2 G для наиболее часто используемых экспериментальных планов.

    Как упоминалось ранее, эта-квадрат представляет собой нескорректированную оценку размера эффекта, которая оценивает величину дисперсии, объясненной на основе выборки, а не на основе всей совокупности. Омега-квадрат (ω 90 251 2 90 252 ) был предложен для коррекции этой погрешности (Hayes, 1963), хотя это в лучшем случае менее предвзятая оценка (Winkler and Hays, 1975).Как и в случае с поправкой Хеджеса для d Коэна, предоставление ω 2 вместо η 2 формально правильно. Однако разница обычно невелика, и погрешность уменьшается по мере увеличения размера выборки. В межсубъектных планах с фиксированными коэффициентами ω 2 и ω 2 p можно рассчитать по формулам, приведенным Олейником и Альгиной (2000) и Бейкманом (2005):

    ω2=dfeffect×(MSeffect-MSerror)SStotal+MSerror(14) ωp2=dfeffect×(MSeffect-MSerror)dfeffect×MSeffect+(N-dfeffect)×MSerror(15)

    Для внутрисубъектных планов ω 2 p рассчитывается так же, как и для межсубъектных планов (см. выше), но ω 2 рассчитывается по формуле:

    ω2=dfeffect×(MSeffect-MSerror)SStotal+MSsubjects(16)

    Вычисление обобщенного омега-квадрата (ω 2 G ) может стать довольно сложным, в зависимости от конструкции (см. списки формул, предоставленные Олейником и Альгиной, 2003).Учитывая эту сложность и относительно небольшую разницу между смещением и менее смещенной оценкой, я рекомендую исследователям сообщать η 2 G и/или η 2 p , по крайней мере, до обобщения омега-квадрата. автоматически предоставляется пакетами статистического программного обеспечения. Для планов, в которых участники манипулируют всеми факторами, η 2 p и η 2 G идентичны, поэтому можно указать любую величину эффекта.Для планов внутри субъектов и смешанных планов, в которых манипулируют всеми факторами, η 2 p всегда можно рассчитать из значения F и степеней свободы с использованием формулы 13, но η 2 G не может быть рассчитан из сообщенных результатов, и поэтому я рекомендую отчетность η 2 G G для этих конструкций (но обеспечение η 2 P в дополнение к η 2 г будет любезностью для читателей).Дополнительная электронная таблица обеспечивает относительно простой способ расчета η 2 G для часто используемых конструкций. Для планов с измеренными коэффициентами или ковариатами ни η 2 p , ни η 2 G не могут быть рассчитаны из представленных результатов, поэтому я рекомендую сообщать оба η 2 как η 2 G , где первое можно использовать в анализе мощности, а второе можно использовать в мета-анализе или интерпретировать в сравнении с контрольными показателями, предоставленными Cohen (1988).В таблице 2 приведены данные об использовании различных вариантов показателей размера эффекта в семействе r .

    Таблица 2. Краткая информация о размерах эффекта семейства r и их рекомендуемом применении .

    Cohen (1988) предоставил ориентиры для определения малых (η 2 = 0,01), средних (η 2 = 0,06) и больших (η 2 = 0,14) эффектов. Как объясняют Олейник и Альгина (2003), эти контрольные показатели были разработаны для сравнения неограниченных популяций (т.g., мужчины против женщин), и использование этих контрольных показателей при интерпретации величины эффекта η 2 p в планах, включающих ковариаты или повторные измерения, не согласуется с соображениями, на которых основывались контрольные показатели. Хотя η 2 G можно сравнить с эталонными показателями, предоставленными Коэном (1988), это следует делать только в крайнем случае, и предпочтительнее сопоставить величину эффекта с другими эффектами, описанными в литературе (Томпсон , 2007).Величина эффекта общего языка может быть рассчитана для контрастов средних значений и стандартных отклонений двух измерений, как объяснено выше для зависимого и независимого t -тестов. На этом мы завершаем общее изложение того, как рассчитывать и сообщать о величине эффекта. Чтобы подчеркнуть некоторые более практические соображения, я приведу пример, в котором те же два набора наблюдений анализируются с использованием парных и независимых t -тестов, а также односторонних и повторных измерений ANOVA.

    Иллюстративный пример

    В этом примере я рассмотрю некоторые практические соображения, проанализировав набор данных в таблице 3, который содержит два набора наблюдений. Эти данные будут проанализированы двумя способами: либо как промежуточный план, либо как внутри проекта. Предположим, что «Фильм 1» и «Фильм 2» — это оценки двух разных фильмов по шкале от 1 (очень плохо) до 10 (очень хорошо). Во-первых, давайте рассмотрим ситуацию, когда эти оценки фильмов собираются из двух разных групп.Независимый t -тест даст t (18) = 2,52, p = 0,022 (обратите внимание, что дополнительная таблица также предоставляет результаты статистического теста). Мы можем вычислить d s Коэна, используя:

    ds=8,7−7,7(10−1)0,822+(10−1)0,95210+10−2=1,13(17)

    Таблица 3. Искусственные оценки фильмов .

    Мы можем вставить это значение в G*Power, чтобы получить оценочный размер выборки, необходимый для обнаружения статистически значимого эффекта в повторном исследовании с α = 0.05, мощность = 0,95 и коэффициент распределения участников между условиями, равный 1. Для двустороннего теста анализ мощности показывает, что расчетный размер выборки составит 44 участника. Наконец, помните, что d s Коэна, равное 1,13, является точечной оценкой. 95% доверительный интервал вокруг этой оценки размера эффекта можно рассчитать с помощью процедуры начальной загрузки в ESCI (Cumming and Finch, 2005), которая дает 95% ДИ [0,16, 2,06]. Это указывает на то, что, хотя маловероятно, что людям одинаково нравятся оба фильма, мы вряд ли имеем представление о том, насколько велика разница.Этот уровень неопределенности следует учитывать при планировании размера выборки для исследования (альтернативные подходы к анализу мощности см. в Maxwell et al., 2008).

    Чтобы сообщить о величине эффекта для будущего метаанализа, мы должны вычислить g = 1,08 Хеджеса, что немного отличается от d s Коэна из-за небольшого размера выборки. Чтобы сообщить об этом исследовании, исследователи могли указать в разделе процедуры, что: «Двадцать участников оценивали либо фильм 1 ( n = 10), либо фильм 2 ( n = 10).Участники сообщили о более высоких оценках Фильма 1 ( M = 8,7, SD = 0,82), чем Фильма 2 ( M = 7,7, SD = 0,95), t (18) = 2,95 = 0,022, 95% ДИ [0,17, 1,83], Hedges г с = 1,08». Обратите внимание, что мы предоставляем всю необходимую статистическую информацию (среднее значение, стандартное отклонение и количество участников в каждом условии между субъектами). 95% доверительный интервал разницы между средними предоставляется по умолчанию пакетами статистического программного обеспечения, такими как SPSS, но также рассчитывается в дополнительной электронной таблице.В качестве альтернативы вы можете сообщить о неопределенности данных, указав 95-процентный доверительный интервал вокруг оценки размера эффекта, который можно рассчитать с помощью ESCI (Cumming, 2012). Чтобы интерпретировать этот эффект, мы можем рассчитать размер эффекта общего языка, например, используя дополнительную электронную таблицу, которая указывает, что размер эффекта равен 0,79. Таким образом, мы можем добавить следующую интерпретацию размера эффекта: «Шанс того, что для случайно выбранной пары людей оценка Фильма 1 выше, чем оценка Фильма 2, составляет 79%.”

    Теперь давайте рассмотрим ситуацию, когда оценки фильмов в таблице 3 получены от одной и той же группы лиц, и каждый участник оценил оба фильма. Оба наблюдения сильно коррелированы: r = 0,726. Как следствие, стандартное отклонение оценок различий намного меньше, чем стандартные отклонения оценок каждого фильма независимо друг от друга. Зависимый t -тест даст t (9) = 4.74, р = 0,001. Мы можем вычислить d z Коэна, используя формулу 6, но здесь мы вычисляем знаменатель ( S diff ), используя формулу 8:

    Коэнов dz=1−00,822+0,952−2×0,726×0,82×0,95                  =1,50(18)

    Это заметно более высокий размер эффекта, чем d s Коэна из независимого t -теста. Некоторые исследовательские вопросы можно рассматривать только в пределах предмета (см. общее обсуждение), но в этом примере вам может понадобиться возможность сравнивать рейтинги фильмов независимо от того, все ли люди, оценивающие фильмы, смотрели все разные фильмы.Таким образом, Hedges g rm или Hedges g av обеспечит более релевантную величину эффекта для описания интересующего вас эффекта. , также в этом конкретном случае), что составляет 1,08 (обратите внимание, что g av Хеджеса округляется до того же значения, что и g s Хеджеса в независимом тесте t выше).

    Мы можем вставить d z Коэна в G*Power, чтобы выполнить априорный анализ мощности и найти статистически значимый эффект с α = 0,05 и мощностью 0,95. Для двустороннего теста анализ мощности будет указывать на оценку размера выборки из 8 участников. Это ясно демонстрирует резкое увеличение мощности, которое обеспечивает план повторных измерений, если наблюдения сильно коррелированы. Это также отражено в меньшем 95% доверительном интервале для Коэна d z [0.42, 1.80] (расчеты см. в ESCI, Cumming and Finch, 2005). Чтобы сообщить об этом исследовании, исследователи могли написать: «Десять участников оценили как фильм 1, так и фильм 2. Участники сообщили о более высоких оценках фильма 1 ( M = 8,7, SD = 0,82), чем фильма 2 ( M = 7,7, ). SD = 0,95), t (9) = 4,74, p = 0,001, 95% ДИ [0,52, 1,48], Hedges г av = 1,00857 95-процентный доверительный интервал разницы снова по умолчанию предоставляется пакетами статистического программного обеспечения, такими как SPSS, а также предоставляется дополнительной электронной таблицей.Обратите внимание, что мы четко отличаем способ расчета 90 856 g 90 857 Хеджеса в этом исследовании от способа, которым он был рассчитан в межсубъектном анализе по нижнему индексу. Чтобы интерпретировать этот результат, мы можем снова вычислить размер общеязыкового эффекта. Для коррелированных выборок Z = M diff / S diff (McGraw and Wong, 1992), а процент, связанный с верхней вероятностью этого значения, равен 0,93 (см. дополнительную таблицу).Поэтому мы можем добавить интерпретацию: «С учетом индивидуальных различий в оценках фильмов вероятность того, что люди, которые смотрят оба фильма, предпочтут фильм 1, а не фильм 2, составляет 93%».

    Вместо использования t -тестов мы могли бы проанализировать данные с помощью дисперсионного анализа (ANOVA). Однофакторный дисперсионный анализ, отражающий независимые выборки t -test, даст F (1, 18) = 6,34, p = 0,022, а статистическое программное обеспечение, такое как SPSS, даст величину эффекта η 2 р = 0.26 (что идентично η 2 G в дисперсионном анализе между субъектами). Этот размер эффекта идентичен коэффициенту Коэна d s , равному 1,13, что можно увидеть, если преобразовать d s Коэна в r , используя формулу 3:

    . rpb=1,131,132+202−2×2010×10=0,51(19)

    и поскольку в однофакторном дисперсионном анализе r 2 = η 2 p , 0,51 2 = 0,26. Вставка η 2 p = 0.26 в G*Power для выполнения априорного анализа мощности для двух групп, α = 0,05 и мощности 0,95 даст общий размер выборки 40. Эта оценка размера выборки отличается от размера выборки 44, который мы нашли для Коэна d s 1.13. Если бы мы использовали коэффициент Коэна d pop (что равно 1,19), два анализа мощности дали бы одинаковую оценку размера выборки в 40 человек. оценку размера эффекта, когда они используют Коэна d s в анализе мощности, но они не делают поправку на это смещение, когда они используют η 2 p .Чтобы исправить смещение ω 2 2

    P можно рассчитать, и хотя я рекомендую отчетность η 2 P или η 2 G по практическим причинам, расчет Ω 2 p для простых конструкций. В однофакторном дисперсионном анализе с одинаковыми размерами выборки в каждой ячейке ω 2 p можно рассчитать по формуле:

    ωp2=1×(5−0,789)1×5+(20−1)×0.789(20)

    Для разности токов ω 2 p = 0,21, но, как объяснено выше, вычисление ω 2 p может стать довольно сложным в более сложных проектах, и поэтому я рекомендую сообщить 9052 η 2 р . Чтобы сообщить об этом анализе, исследователи могли написать в разделе процедуры: «Двадцать участников оценили либо Фильм 1 ( n = 10), либо Фильм 2 ( n = 10). Участники сообщили о более высоких оценках Фильма 1 ( M = 8.7, SD = 0,82), чем фильм 2 ( M = 7,7, SD = 0,95), F (1, 18) = 6,34, P = 0,022, η 2 p = 0,26, 90% ДИ [0,02, 0,48]». В то время как в тесте t мы сравниваем две группы и, следовательно, можем вычислить доверительный интервал для средней разницы, мы можем выполнить тест F для сравнения между более чем двумя группами. Чтобы иметь возможность сообщать о неопределенности в данных, мы по-прежнему должны сообщать о доверительном интервале, но теперь мы сообщаем о доверительном интервале вокруг величины эффекта.Смитсон (2001) предоставил превосходное объяснение доверительных интервалов вокруг оценок размера эффекта для тестов F , которое сопровождается простыми в использовании файлами синтаксиса для ряда пакетов статистического программного обеспечения (включая SPSS). 90%-й доверительный интервал указывается в связи с тем, что тест F всегда является односторонним тестом, а 90% доверительный интервал всегда исключает 0, когда тест F является статистически значимым, в то время как 95% доверительный интервал – нет.

    Наконец, давайте посмотрим на повторные измерения ANOVA, который отражает зависимый t -критерий, который дает F (1, 9) = 22,50, p = 0,001. Статистическое программное обеспечение, такое как SPSS, обеспечит η 2

    p p p = 0,71 и с использованием дополнительной электронной таблицы мы находим, что η 2 г = 0,26 (который идентичен η 2 г при анализе данных в виде плана между субъектами).Для этой простой конструкции мы снова можем легко вычислить ω 2 p :

    ωp2=1×(5−0,222)1×5+(10−1)×0,222=0,68(21)

    Мы можем использовать η 2 p для выполнения анализа мощности. Уже объяснялось, что для внутрисубъектных планов η 2 p из SPSS отличается от η 2 p из G*Power. G*Power предлагает два варианта: «как в SPSS» и «как в Cohen (1988) — рекомендуется.Разница между ними заключается в том, как рассчитывается параметр нецентральности (λ), который используется при расчетах мощности. Полное объяснение нецентрального распределения t выходит за рамки этой статьи, но доступное введение см. в Cumming (2012). В формуле используется либо N (Cohen, 1988), либо степени свободы (SPSS). Таким образом, выбор варианта «как в SPSS» всегда будет давать более консервативную оценку. Если мы выберем рекомендуемый вариант «как в Cohen (1988)», G*Power вернет предполагаемый размер выборки из восьми участников.Опять же, следует напомнить читателям, что анализ мощности дает точечную оценку минимального размера выборки, и эти расчеты следует интерпретировать с учетом типичной неопределенности истинного размера эффекта.

    Чтобы сообщить об этом анализе, исследователи могли написать: «Участники сообщили о более высоких оценках Фильма 1 ( M = 8,7, SD = 0,82), чем Фильма 2 ( M = 7,7, SD = 0,95), F (1, 9) = 22,50, р = 0.001; Обратите внимание, что я решил сообщать оба частичных эта-квадрата (включая 90% доверительный интервал, используя сценарии, предоставленные Smithson, 2001) как обобщенный эта-квадрат. Предоставляя η 2 p , исследователи могут выполнять априорный анализ мощности, а предоставляя η 2 G , исследователи могут легко включить исследование в будущий метаанализ, который сравнивает эффекты между разного дизайна (см. Олейник, Альгина, 2003).Предоставление двух размеров эффекта соответствует предположению о том, что сообщение о нескольких размерах эффекта может дать лучшее понимание конкретного эффекта (Preacher and Kelley, 2011).

    Общее обсуждение

    Цель этой статьи состояла в том, чтобы предоставить практическое руководство о том, как рассчитывать и сообщать о величине эффекта для облегчения кумулятивной науки, с упором на t -тесты и дисперсионный анализ. Текущая практика в том, как исследователи сообщают о размерах эффекта, может быть улучшена. Во-первых, исследователи всегда должны сообщать о величине эффекта.При использовании размеров эффекта, основанных на d Коэна, исследователи должны указать, какой стандартизатор используется (например, с помощью индексов). При сообщении размеров эффекта для дисперсионного анализа рекомендуется указывать обобщенный квадрат этата вместо (или в дополнение к) частичного квадрата эта. Наконец, размеры эффекта следует интерпретировать, предпочтительно сравнивая их с другими эффектами, описанными в литературе, или с помощью размера эффекта в общепринятом языке, вместо использования контрольных показателей, предложенных Коэном (1988).В этом учебнике поясняется, о каких величинах эффекта следует сообщать, и предоставляется дополнительная таблица, которую исследователи могут использовать для легкого расчета этих величин эффекта.

    Правильное указание величины эффекта не только облегчает проведение метаанализа, но и облегчает исследователям, опирающимся на предыдущие результаты, выполнение анализа мощности. Учет статистической мощности теста при разработке исследования полезен для кумулятивной науки. По мере увеличения размера выборки систематическая ошибка выборки снижается (т.g., Borenstein et al., 2011), и, следовательно, исследования с высокой мощностью обеспечивают более точную оценку величины эффекта для метаанализов, чем исследования с низкой мощностью. Исследователи должны иметь в виду, что величина наблюдаемого эффекта в исследовании может отличаться от величины эффекта в популяции, и есть основания полагать, что переоценка является обычным явлением, учитывая текущую практику публикации, когда журналы в основном принимают исследования, в которых наблюдается статистически значимый эффект (Lane and Dunlap, 1978). Ранние публикации данных результатов, как правило, завышают величину эффекта из-за регрессии к среднему значению (Fiedler et al., 2012). По этим причинам нецелесообразно сосредотачиваться исключительно на априорном анализе мощности при определении размера выборки для будущего исследования (если нет очень точной оценки размера эффекта), и исследователям следует обратить внимание на альтернативные подходы к планированию выборки. размеров (см. Maxwell et al., 2008).

    Поскольку анализ мощности неотъемлемо связан с проверкой значимости нулевой гипотезы, некоторые исследователи неоднозначно относятся к обоснованию размера выборки исследования на основе вероятности наблюдения значительного эффекта.Часто слышимая критика тестов значимости нулевой гипотезы заключается в том, что нулевая гипотеза никогда не бывает верной (Schmidt, 1992; Tabachnick and Fidell, 2001). Однако нулевая гипотеза часто является хорошей (а иногда и чрезвычайно точной) аппроксимацией (Murphy et al., 2012), и в строго контролируемых экспериментах можно сделать направление разницы, а не величину эффекта. занимает центральное место в цели исследования (Cohen, 1995). С другой стороны, можно обоснованно утверждать, что даже когда исследователи проводят тест значимости нулевой гипотезы, они в действительности проверяют, настолько ли мал эффект, что его можно считать пренебрежимо малым (подробное описание таких тестов минимального эффекта см. , см. Мерфи и Майорс, 1999).Это, в свою очередь, требует, чтобы исследователи, по крайней мере неявно, учитывали только те эффекты, которые достаточно велики, чтобы быть теоретически интересными.

    Настоящая статья ограничивается размерами эффекта для стандартизированных разностей средних. Подобные сравнения чрезвычайно распространены в экспериментальной психологии, но едва ли охватывают все возможные схемы исследования. Вместо полного обзора величины эффекта в экспериментальных исследованиях (например, Grissom and Kim, 2005) я попытался предоставить практический учебник, целью которого является быстрый, но полный обзор одного конкретного типа исследовательского вопроса.Поэтому я рассматриваю ограничение как силу и думаю, что аналогичные специализированные обзоры для других типов анализа (например, отношения рисков, многоуровневое моделирование) были бы очень полезны для научного сообщества, особенно когда они находятся в открытом доступе. Когда это возможно, будущие статьи о расчетах размера эффекта должны предоставлять программное обеспечение или электронные таблицы, чтобы исследователи могли максимально упростить внедрение этих расчетов в свой рабочий процесс. Прекрасные примеры см. в ESCI (Cumming and Finch, 2005), программном обеспечении доверительного интервала Smithson (2001) и G*Power (Faul et al., 2009). Обратите внимание, что самый простой способ способствовать кумулятивной науке — поделиться данными исследований, о которых вы сообщаете. Интернет позволяет невероятно легко загружать файлы данных, чтобы делиться ими с научным сообществом (например, см. www.openscienceframework.org). Особенно для смешанных планов или анализов с ковариатами, где вычисление ω 2 G становится довольно сложным, совместное использование данных всегда позволит исследователям, которые хотят выполнить метаанализ, рассчитать необходимые величины эффекта.

    Более фундаментальный вопрос заключается в том, учитывают ли размеры эффекта внутрисубъектных планов изменчивость внутри субъектов (η 2 p и ω 2 p ) или которые учитывают корреляцию между измерениями (Cohen’s d z ) являются точным описанием размера эффекта или того, являются ли размеры эффекта, которые не контролируют изменчивость внутри субъектов (η 2 G и ω 2 G ), или этот контроль корреляции между измерениями (например,g., Cohen’s d rm или Cohen’s d av ) являются предпочтительными. Я считаю, что это обсуждение в настоящее время предвзято из-за того, что можно было бы назвать дизайнизмом , неологизмом, относящимся к неявному убеждению, что межсубъектные планы являются экспериментальным планом по умолчанию и что величины эффекта, рассчитанные на основе межсубъектных планов, более логичны или естественны. . Защита дизайнизма заключается в следующем. Желательно иметь возможность сравнивать размеры эффекта в разных планах, независимо от того, исходят ли наблюдения из плана внутри или между субъектами.Поскольку невозможно контролировать индивидуальные различия в планах между субъектами, мы должны рассматривать размер эффекта, который не учитывает индивидуальные различия, как размер естественного эффекта. Как следствие, величины эффекта, учитывающие индивидуальные различия, «завышены» по сравнению со «значением по умолчанию» (например, Dunlap et al., 1996).

    Такое рассуждение игнорирует тот факт, что многие эффекты в психологии по своей сути контекстуальны. Например, рассмотрим исследование того, как люди замедляются в задаче на время реакции после того, как они сделали ошибку ( замедление после ошибки ; Кролик, 1966).Недавно Дутиль и соавт. (2012) предположили, что лучший способ ответить на исследовательские вопросы о замедлении после ошибки — это вычислить попарные сравнения вокруг каждой ошибки и проанализировать эти оценки различий (против нуля или против оценки разницы в других условиях), а не усреднение ответов. раз по всем ответам до и после ошибки и сравнить эти два средних значения в тесте парных выборок t . Другими словами, оценка различий является наиболее естественной единицей анализа в таких исследованиях.Поскольку план между субъектами невозможен, никогда не будет метаанализа, который сравнивает замедление после ошибки между планами между субъектами и внутри субъектов. Поскольку баллы различий являются естественной единицей анализа, можно утверждать, что большие размеры эффекта не преувеличены, а внутрисубъектный анализ просто отражает другой исследовательский вопрос, рассматриваемый на другом уровне анализа (внутрииндивидуальном, а не межиндивидуальном). ). Существуют четкие параллели с продолжающимися дискуссиями о мерах доли дисперсии, объясняемой в многоуровневом моделировании, где гораздо чаще предполагается, что единицей анализа по умолчанию являются повторные измерения отдельных лиц (см. Tabachnick and Fidell, 2001).

    Когда эмпирические вопросы могут быть изучены только в планах внутри субъектов (например, в случае замедления после ошибки), размеры эффекта, которые контролируют внутрисубъектную изменчивость (η 2 p и ω 2 p ), или которые учитывают корреляцию между измерениями ( d z Коэна ) являются разумной статистикой для отчета. Это прекрасно демонстрирует размер общеязыкового эффекта (который можно рассчитать непосредственно из d s Коэна или d z Коэна).В иллюстративном примере, представленном ранее в этой статье, мы пришли к выводу, что вероятность того, что для случайно выбранной пары индивидуумов оценка Фильма 1 выше, чем оценка Фильма 2, составляет 79% (в межсубъектном эксперименте), но что Вероятность того, что человек, посмотревший оба фильма (внутрисубъектный эксперимент), предпочтет фильм 1 фильму 2, составляет 93%. CL 93% — это не завышенная оценка, а точное описание вероятности в коррелированных выборках, где измерения парные.Мы можем рассчитать величину эффекта для внутрисубъектных планов (например, Коэна d rm и Коэна d av ), которые можно обобщить на межсубъектные планы, но если наша цель состоит в том, чтобы сделать утверждение о том, кто смотрит оба фильма, предпочтет фильм 1 фильму 2, размер эффекта, который обобщает ситуации, когда две разные группы людей смотрят один из двух фильмов, может не дать лучший ответ на наш вопрос.

    Обобщение планов (например, включающих или не включающих блокирующие факторы) по-прежнему может быть желательным.Можно разработать эквивалент «внутрисубъектного обобщенного эта-квадрата», который исключает вариацию из-за индивидуальных различий в знаменателе (как η 2 p ) для расчета размера эффекта, но включает вариацию из-за манипулирования. факторы (как η 2 G ), если кто-то был склонен выступить против «дизайнизма». В текущей статье подчеркивается, что не существует единого «верного» определения стандартизированного размера эффекта.Исследователям необходимо выбрать, какая величина эффекта обеспечивает наилучшее обобщение эффекта, и указать, о какой величине эффекта они сообщают (Thompson, 2007; Cumming, 2012). Эффективным способом сделать это является использование букв нижнего индекса, которые используются в текущей статье.

    В конце концов, выбор расчета величины эффекта зависит от вопроса исследования и плана эксперимента. Важно четко указать, какая величина эффекта рассчитывается, и сделать мотивированный выбор, о какой величине эффекта следует сообщать.В текущем обзоре я надеюсь предоставить практическое руководство, которое поможет исследователям в выборе и расчете величины эффекта, в убеждении, что более осознанный выбор того, какие оценки величины эффекта сообщать, будет способствовать кумулятивной науке.

    Заявление о конфликте интересов

    Автор заявляет, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могли бы быть истолкованы как потенциальный конфликт интересов.

    Благодарности

    Я хотел бы поблагодарить Эдгара Эрдфельдера за объяснение различий между f Коэна в G*Power и SPSS, Джеффа Камминга за то, что он поделился своими мыслями о стандартизаторах, Джоба ван Вольферена за предложение создать древовидную диаграмму в электронной таблице, и Ирис Шнайдер и Эллен Эверс за комментарии к предыдущему проекту этой статьи.

    Дополнительные материалы

    Дополнительный материал к этой статье можно найти в Интернете по адресу: http://www.frontiersin.org/journal/10.3389/fpsyg.2013.00863/abstract

    Сноски

    Ссылки

    Аберсон, CL (2010). Прикладной анализ мощности для поведенческих наук . Нью-Йорк, штат Нью-Йорк: Рутледж.

    Баккер, М., ван Дейк, А., и Вихертс, Дж. М. (2012). Правила игры называются психологической наукой. Перспектива. Psychol. Наука . 7, 543–554. дои: 10.1177/17456

    459060

    Полнотекстовая перекрестная ссылка

    Боренштейн, М., Хеджес, Л.В., Хиггинс, Дж.П., и Ротштейн, Х.Р. (2011). Введение в метаанализ . Хобокен, Нью-Джерси: Wiley.

    Бранд, А., Брэдли, М.Т., Бест, Л.А., и Стойка, Г. (2008). Точность оценок размера эффекта из опубликованных психологических исследований. Восприятие. Mot. Навыки 106, 645–649. doi: 10.2466/pms.106.2.645-649

    Опубликовано Резюме | Опубликован полный текст | Полный текст перекрестной ссылки

    Коэн, Дж. (1965). Некоторые статистические вопросы в психологических исследованиях», в Handbook of Clinical Psychology , ed B.Б. Вулман (Нью-Йорк, штат Нью-Йорк: McGraw-Hill), 95–121.

    Коэн, Дж. (1988). Статистический анализ мощности для поведенческих наук . Нью-Йорк, штат Нью-Йорк: Routledge Academic.

    Коэн, Дж. (1995). Земля круглая (p<05): Ответ. утра. Психол . 50, 1103. doi: 10.1037/0003-066X.50.12.1103

    Полнотекстовая перекрестная ссылка

    Камминг, Г. (2012). Понимание новой статистики: величины эффекта, доверительные интервалы и метаанализ .Нью-Йорк, штат Нью-Йорк: Рутледж.

    Данлэп, В.П., Кортина, Дж.М., Васлоу, Дж.Б., и Берк, М.Дж. (1996). Метаанализ экспериментов с подобранными группами или планами повторных измерений. Психология. Методы 1, 170–177. doi: 10.1037/1082-989X.1.2.170

    Полнотекстовая перекрестная ссылка

    Дутиль, Г., ван Равенцвай, Д., Ньювенхейс, С., ван дер Маас, Х.Л., Форстманн, Б.У., и Вагенмакерс, Э.Дж. (2012). Как измерить замедление после ошибки: путаница и простое решение. Дж. Матем. Психол . 56, 208–216. doi: 10.1016/j.jmp.2012.04.001

    Полнотекстовая перекрестная ссылка

    Эллис, PD (2010). Основное руководство по величине эффекта: статистическая мощность, метаанализ и интерпретация результатов исследования . Кембридж: Издательство Кембриджского университета. дои: 10.1017/CBO9780511761676

    Полнотекстовая перекрестная ссылка

    Фаул Ф., Эрдфельдер Э., Бюхнер А. и Ланг А.-Г. (2009). Статистический анализ мощности с использованием G*Power 3.1: тесты для корреляционного и регрессионного анализа. Поведение. Res. Методы 41, 1149–1160. doi: 10.3758/BRM.41.4.1149

    Опубликовано Резюме | Опубликован полный текст | Полный текст перекрестной ссылки

    Фидлер, Ф. (2002). Пятое издание Руководства по публикациям АПА: почему его рекомендации по статистике столь противоречивы. Учеб. Psychol. . 62, 749–770. дои: 10.1177/001316402236876

    Полнотекстовая перекрестная ссылка

    Фидлер, К., Катцнер, Ф., и Крюгер, Дж. И. (2012). Долгий путь от контроля α-ошибок до собственно проблем валидности с недальновидными ложноположительными дебатами. Перспектива. Psychol. Наука . 7, 661–669. дои: 10.1177/17456

    462587

    Полнотекстовая перекрестная ссылка

    Гласс, Г.В., Макгоу, Б., и Смит, М.Л. (1981). Метаанализ в социальных исследованиях . Беверли-Хиллз, Калифорния: Sage.

    Гриссом, Р. Дж., и Ким, Дж. Дж. (2005). Размеры эффектов для исследований: широкий практический подход . Махва, Нью-Джерси: Лоуренс Эрлбаум Ассошиэйтс.

    Hayes, WL (1963). Статистика для психологов . Нью-Йорк, штат Нью-Йорк: Холт, Райнхарт и Уинстон.

    Хеджес Л.В. и Олкин И. (1985). Статистические методы метаанализа . Сан-Диего, Калифорния: Academic Press.

    Келли, К. (2005). Влияние ненормальных распределений на доверительные интервалы вокруг стандартизированной разности средних: бутстрепные и параметрические доверительные интервалы. Учеб. Psychol. . 65, 51–69. дои: 10.1177/0013164404264850

    Полнотекстовая перекрестная ссылка

    Кеппель, Г. (1991). Дизайн и анализ: справочник исследователя .Энглвуд Клиффс, Нью-Джерси: Прентис Холл.

    Клайн, РБ (2004). Тестирование вне значимости: реформирование методов анализа данных в поведенческих исследованиях . Вашингтон, округ Колумбия: Американская психологическая ассоциация. дои: 10.1037/10693-000

    Полнотекстовая перекрестная ссылка

    Лейн, Д.М., и Данлэп, В.П. (1978). Оценка размера эффекта: систематическая ошибка, возникающая из-за критерия значимости в редакционных решениях. Бр. Дж. Матем. Стат. Психол . 31, 107–112. DOI: 10.1111 / j.2044-8317.1978.tb00578.x

    Полнотекстовая перекрестная ссылка

    Максвелл, С.Э., и Делани, Х.Д. (2004). Планирование экспериментов и анализ данных: перспектива сравнения моделей , 2-е изд. Махва, Нью-Джерси: Эрлбаум.

    Максвелл, С.Э., Келли, К., и Рауш, Дж.Р. (2008). Планирование размера выборки для статистической мощности и точности оценки параметров. год. Преподобный Психол . 59, 537–563. doi: 10.1146/annurev.psych.59.103006.093735

    Опубликовано Резюме | Опубликован полный текст | Полный текст перекрестной ссылки

    Макгроу, К.О. и Вонг С.П. (1992). Статистика размера общеязыкового эффекта. Психология. Бык . 111, 361–365. дои: 10.1037/0033-2909.111.2.361

    Полнотекстовая перекрестная ссылка

    Моррис, С.Б., и ДеШон, Р.П. (2002). Сочетание оценок размера эффекта в метаанализе с повторными измерениями и планами независимых групп. Психология. Методы 7, 105–125. дои: 10.1037/1082-989X.7.1.105

    Опубликовано Резюме | Опубликован полный текст | Полный текст перекрестной ссылки

    Мерфи, К., Майорс, Б., и Волах, А. (2012). Статистический анализ мощности: простая и общая модель для традиционных и современных проверок гипотез . Нью-Йорк, штат Нью-Йорк: Routledge Academic.

    Мерфи, К.Р., и Майорс, Б. (1999). Проверка гипотезы о незначительном эффекте лечения: тесты минимального эффекта в общей линейной модели. J. Appl. Психол . 84, 234–248. дои: 10.1037/0021-9010.84.2.234

    Полнотекстовая перекрестная ссылка

    Олейник С. и Альгина Дж.(2000). Меры размера эффекта для сравнительных исследований: приложения, интерпретации и ограничения. Контемп. Educ. Психол . 25, 241–286. doi: 10.1006/ceps.2000.1040

    Опубликовано Резюме | Опубликован полный текст | Полный текст перекрестной ссылки

    Олейник С. и Альгина Дж. (2003). Обобщенная статистика эта и омега-квадрат: меры размера эффекта для некоторых распространенных исследовательских планов. Психология. Методы 8, 434–447. дои: 10.1037/1082-989X.8.4.434

    Опубликовано Резюме | Опубликован полный текст | Полный текст перекрестной ссылки

    Пуанкаре, Х.(1952). Наука и метод . Нью-Йорк, штат Нью-Йорк: Dover Publications.

    Проповедник, К. Дж., и Келли, К. (2011). Меры размера эффекта для моделей посредничества: количественные стратегии для передачи косвенных эффектов. Психология. Методы 16, 93–115. дои: 10.1037/a0022658

    Опубликовано Резюме | Опубликован полный текст | Полный текст перекрестной ссылки

    Розенталь, Р. (1991). Метааналитические процедуры для социальных исследований . Ньюбери-Парк, Калифорния: SAGE Publications, Incorporated.

    Розенталь, Р. (1994). «Параметрические меры размера эффекта», в . Справочник по исследовательскому синтезу , ред. Х. Купер и Л. В. Хеджес (Нью-Йорк, штат Нью-Йорк: Sage), 231–244.

    Шмидт, Ф.Л. (1992). Что на самом деле означают данные. утра. Психол . 47, 1173–1181. doi: 10.1037/0003-066X.47.10.1173

    Полнотекстовая перекрестная ссылка

    Смитсон, М. (2001). Правильные доверительные интервалы для различных размеров и параметров эффекта регрессии: важность нецентральных распределений при вычислении интервалов. Учеб. Psychol. . 61, 605–632. дои: 10.1177/00131640121971392

    Полнотекстовая перекрестная ссылка

    Табачник, Б.Г., и Фиделл, Л.С. (2001). Использование многомерной статистики, 4-е издание . Бостон: Аллин и Бэкон.

    Томпсон, Б. (2006). Основы поведенческой статистики: подход, основанный на инсайтах . Нью-Йорк, штат Нью-Йорк: Гилфорд.

    Томпсон, Б. (2007). Величина эффекта, доверительные интервалы и доверительные интервалы для величины эффекта. Психология. Щ . 44, 423–432. doi: 10.1002/pits.20234

    Полнотекстовая перекрестная ссылка

    Винклер Р.Л. и Хейс В.Л. (1975). Статистика: вероятность, вывод и решение, 2-е изд. . Нью-Йорк, Нью-Йорк: Холт.

    Приложение

    Параметр Cohen’s f 2 , используемый в G*Power, отличается от параметра Cohen’s f 2 , который используется в статистическом программном пакете SPSS. С η 2 2 P = F 2 /1 + F /1 + F 2 , это также означает значения для η 2 P не взаимозаменяемыми между SPSS и G * Сила.Как объясняет Erdfelder (личное общение) fSPSS2=SPSSηp21−SPSSηp2

    Затем подставьте его в следующую формулу:

    fG*Power2=fSPSS2×N−kN×(m−1)m×(1−ρ)

    , где N — размер выборки, k — количество групп, m — количество повторений, а ρ — (средняя) корреляция между показателями, которую можно, наконец, преобразовать в частичную эта, поскольку она используется в G*Power:

    G*Мощностьηp2=fG*Мощность2/1+fG*Мощность2.

    Численный расчет электрического поля, обусловленного распределением заряда

    Теперь о программе. Ждать. Я не собираюсь показывать вам эту часть. Я знаю, это воняет, но так и будет. Вероятно, есть много вводных классов по физике, которые используют эту проблему как часть домашнего задания или что-то в этом роде. Не хочу портить решение. Прости. Тем не менее, я покажу вам, как это выглядит.

    Да. Это выглядит очень красиво, но это не так уж полезно.Чтобы определить точность этой численной модели, мне нужно рассчитать электрическое поле вдоль оси, перпендикулярной стержню, и в центре стержня. Это область, в которой я также могу рассчитать электрическое поле с помощью исчисления, чтобы увидеть, насколько хорошо согласуются два метода.

    Опуская вывод, у меня есть два выражения для величины электрического поля вдоль оси, перпендикулярной центру стержня. Вторая формула является приближенной, если длина стержня велика по сравнению с расстоянием от стержня.

    Хорошо, приступим к расчету. Я хочу изобразить величину электрического поля как расстояние от стержня для всех трех методов (два уравнения и численный метод). Вот мои начальные параметры.

    • Длина стержня = 0,5 метра.
    • Общий заряд = 1 x 10 -8 Кулонов.
    • Количество штук (для численного расчета) = 100.

    Вот сюжет. Горизонтальная ось представляет собой отношение расстояния до стержня к длине стержня.

    Контент

    Этот контент также можно просмотреть на сайте, откуда он взят.

    Здесь вы можете увидеть явное различие между аппроксимацией и двумя другими методами расчета электрического поля. Это особенно верно по мере того, как точка наблюдения удаляется от стержня, и приближение, что z намного меньше, чем L , очевидно, неверно.

    Теперь, когда этот метод работает, давайте протестируем численную модель.Насколько решение зависит от количества частей, на которые разбит стержень? Это график величины электрического поля в середине стержня на расстоянии 0,1 л .

    Добавить комментарий

    Ваш адрес email не будет опубликован.