Какой рейтинг вас больше интересует?
|
Главная / Главные темы / Тэг «statistics»
Your Unique Visitors 2012-12-17 22:45:33
For all of you stats junkies — you know who you are! — we’ve added some holiday ...
+ развернуть текст сохранённая копия
For all of you stats junkies — you know who you are! — we’ve added some holiday cheer to your WordPress.com Stats Page. In addition to the number of views your site receives, you can now keep tabs on how many unique visitors come to your site, all on a single, easy-to-read chart. A visitor [...]
Тэги: ach, analytic, statistic, stats, technical, uniques, wordpress.com
ГМО увеличивает продолжительность жизни мужчин 2012-09-30 10:01:14
Originally posted by
+ развернуть текст сохранённая копия
Originally posted by scinquisitor at ГМО увеличивает продолжительность жизни мужчин Недавно в прессе появились сообщения примерно такого содержания: “ Раковые опухоли у крыс доказали опасность ГМО". Информационным поводом стала статья, опубликованная в рецензируемом научном журнале Food and Chemical Toxicology. Ниже мы покажем, что данный газетный заголовок также следует из опубликованных экспериментов британских ученых из Франции и Италии, как и заголовок изложенной здесь статьи. 2.2% крыс изучаемой линии болеют этим заболеванием. Учитывая эти обстоятельства, а также то, что всего было 60 крыс, которые ели ГМО и 10 крыс в контрольной группе, нет ничего удивительного в полученных результатах. Вероятность того, что по случайным причинам хотя бы у 2 крыс из 60 возникнет опухоль, вероятность возникновения которой у одной крысы составляет 2.2%, равна 38%. Вероятность того, что такая опухоль возникнет хотя бы у одной крысы из контроля примерно в два раза меньше. Вероятность того, что такая опухоль наступит хотя бы у двух крыс из 60, которые ели ГМО, но не наступит ни у одной крысы из контроля, примерно равна 30%. Случилось какое-то чудо? Нет, случилось весьма вероятное событие. А то, что крысы с таким опухолями первыми откидывают лапки, разумеется, связано с тем, что эта опухоль появляется в раннем возрасте. И даже если опухоль будет не смертельна, крыс усыпят, как только ее масса превысит 25% массы тела. Сравните две правдивые фразы: - Интересно отметить, что первые две крысы мужского пола, которые отбросили концы в группах, поедавших ГМО, были диагностированы опухолью почек, с массой большей 25% массы тела.
- Количество опухолей почек в группе крыс, которые ели ГМО, не превосходит ожидаемого количества опухолей данного типа для данной линии крыс.
Далее авторы зачем-то пишут, что максимальная разница в смертности между группой крыс, поедавших ГМО, и контролем была такой: а.) В пять раз больше смертей по сравнению с контролем в течение 17 месяца для группы самцов, которая имела 11% ГМО в диете. б.) В шесть раз больше смертей по сравнению с контролем в течение 21 месяца для группы самок, которая имела 22% ГМО в диете. Простите, но, во-первых, это вранье! Найдутся такие месяца, во время которых вообще ни одна контрольная крысы не умерла, зато умерла хотя бы одна крыса из группы ГМО, а значит, смертность в этом месяце между группами различалась в бесконечное количество раз. Ну, например, в том месяце, в котором погибла одна из крыс с опухолью почек. Во-вторых, к чему эти цифры? В двух годах 24 месяца. Разумеется, найдутся такие месяцы, где разница между группами будет высокой и такие где ее не будет вовсе. Сравните две правдивые фразы: - В шесть раз больше смертей в течение 21 месяца для группы самок, которая имела 22% ГМО в диете.
- В некоторые месяца смертность в группе крыс, которые ели ГМО, была выше, чем в контроле, а в другие ниже. Но все эти отличия статистически не значимы.
Следующий перл авторов заключается в утверждении, что среди самок, поедавших ГМО, было в 2-3 раза больше смертей, чем в контрольной группе. Какова статистическая значимость этого утверждения? Авторы ее не приводят. Из данных, изображенных на Рисунке 1, следует, что среди самок их контрольной группы к обозначенному авторами сроку погибло две. В группах, которые ели ГМО, погибло 29 из 60 крыс. Если смерть считать “успехом” (да-да, статистика – бездушная наука), то мы имеем таблицу 2x2 для точного теста Фишера: в контрольной группе 2 успеха и 8 не успехов, в группе ГМО 29 успехов и 31 не успехов. Статистическая значимость различий между группами согласно одностороннему тесту Фишера равна 0.09. Это, как и раньше, не преодолевает порог 0.05, т.е. статистически значимой разницы между смертностью в группах нет. Сравните две правдивые фразы: - Среди самок, которые ели ГМО, было в 2-3 раза больше смертей, чем в контрольной группе.
- Статистически значимых различий между смертностью в группе самок, которые ели ГМО, и группе самок, которые не ели ГМО, не обнаружено. Для самцов, кстати, тоже.
Ну и конечно не обошлось без моей любимой статистической ошибки – отсутствия поправки на множественные сравнения в ее самом прямом виде. Об этом я давно писал в сборнике научных анекдотов. В начале данной статьи я приводил длинный список органов, которые изучались во время вскрытия крыс. Разумеется, найдутся такие органы, в которых будет больше опухолей в одной группе, чем в другой. В таблице результатов авторы приводят только 6 комбинаций органа и пола крысы (из многих десятков возможных). Подозреваю, что те органы, в которых у крыс, которые ели ГМО, было меньше патологий (не потому, что ГМО предотвращают патологии, а потому, что так велит статистика в силу большого количества сравнений) были выкинуты из рассмотрения т.к. “это абсурд!” Хотелось бы взглянуть на данные по всем органам, но авторы их предусмотрительно замели под ковер. Но вот самое большое различие между ГМО и контрольными группами самцов крыс было в количестве крыс с патологиями печени. В контроле две крысы имели патологии печени, а в группах, которые ели ГМО, 30 крыс оказались с патологиями печени (из 60). Это та же ситуация, что была со смертностью у самок и это отличие статистически не значимо без каких-либо поправок на множественные сравнения. Если бы ГМО в диете не влияло на частоту возникновения патологий печени у самцов крыс, мы бы получили такое же или еще большее различие между группами с 30% вероятностью. А если еще и учесть, что смотрели на десятки органов, причем крыс разного пола рассматривали отдельно, то вероятность того, что найдется орган, в котором хотя бы у представителей одного пола будет такое же или большее различие в частоте патологий стремится к единице. Сравните две правдивые фразы: - Крысы-самцы, которые ели ГМО, в два раза чаще имели патологии печени.
- Статистически достоверных различий в количестве патологий печени или каких-либо других органов между крысами, которые ели или не ели ГМО, не обнаружено.
В конце приводятся страшные картинки крыс, которые ели ГМО. Эти картинки производят впечатление на тех, кто никогда в жизни не видел других крыс, которые выглядят точно также (или даже хуже), но никогда не ели ГМО. Если бы более частое возникновение опухолей у крыс, которые ели ГМО, подтверждалось статистическим анализом, был бы предмет для опасений. Но этого нет. Создается впечатление, что авторы ставили целью не разобраться в том, как ГМО действует на крыс, а создать качественный ужастик и в этом они преуспели. Разумеется, из 180 крыс с “ненормальной” диетой (содержащей ГМО или гербицид) найдется в 9 раз больше примеров для ужастиков, чем среди 20 крыс в контроле, даже если страшные опухоли, подобные тем, что показаны на картинках, происходят во всех группах с одинаковой частотой, не зависят от наличия в еде ГМО или гербицида R в воде. А если в течении двух лет наблюдать за 180 крысами, примеры страшных опухолей Вы, конечно, найдете. Недавно в газетах было объявлено: « Роспотребнадзор приостановил ввоз генномодифицированной кукурузы в Россию. Запретом на импорт ГМО-початков Геннадий Онищенко ответил на заявление французских ученых, что ГМО-кукуруза вызывает рак. Теперь российским генетикам предстоит выяснить, насколько обоснованными были выводы французских коллег» Сравните две правдивые фразы: - Запретом на импорт ГМО-початков Геннадий Онищенко ответил на заявление французских ученых, что ГМО-кукуруза вызывает рак.
- Некоторые российские чиновники порой верят в полную ерунду.
Также не ясно, почему задачу проверки обсуждаемой работы условно поручили генетикам? Достаточно попросить любого математика проверить изложенные в работе цифры на статистическую достоверность. Ее там нет. Хотя, кажется, что авторы проделали огромный труд, пытаясь ее найти и создавая видимость того, что достоверность достигнута. Напоследок хочу отметить, что хотя обсуждаемая статья, вопреки заявлениям авторов, не доказывает вред от данной ГМ кукурузы, она и не подтверждает ее безопасность. Главная проблема работы – малый размер контрольной выборки. Из-за этого не удается сделать никаких достоверных выводов о влиянии или не влиянии ГМ кукурузы на основании данного исследования. Безопасность генетически модифицированных вариантов продуктов питания следует из совершенно других соображений, но это тема для отдельной статьи.
Тэги: biology, science, statistic
Статистика ВИЧ-инфекции в Российской Федерации в 2011 г. 2012-03-26 08:11:00
+ развернуть текст сохранённая копия
ВИЧ-инфекция в Российской Федерации в 2011 г.
Общее число россиян,
инфицированных ВИЧ, зарегистрированных в Российской Федерации до 31 декабря 2011 г. составило 647 578 человек (по данным,
сообщенным на 25 января 2012 г.), в том числе 5 844 детей в возрасте до 15 лет.
По состоянию на 25.02.2012 г.: не введены в базу данных 1 759 присланных
новых случаев ВИЧ-инфекции, кроме того, не прислано по оценочным данным,
870-900 новых случаев ВИЧ-инфекции. Итого на 31.12.2011 г. по оценочным данным
после получения и ввода всех данных будет зарегистрировано всего 650 231
инфицированных ВИЧ.
За весь период наблюдения в РФ с 1985 г. было выявлено 16 314
ВИЧ-инфицированных иностранных граждан, в том числе 1 489 за 2011 г.
В 2011 г. территориальными
центрами по профилактике и борьбе со СПИД было сообщено о 58971 новых случаях ВИЧ-инфекции среди
граждан Российской Федерации, однако, полные данные пока не поступили. Показатель
заболеваемости в 2011 г. составил по
предварительным данным 41,6 на 100 тыс. населения, что превышает показатель 2010 г. (41,2). По
оценочным данным после получения и ввода всех данных будет зарегистрировано 61
615 новых случаев ВИЧ-инфекции в 2011 г. и показатель заболеваемости повысится до 43,4 на 100 тыс. населения, т.е.
на 5% больше, чем в 2010 г. В 2011
г. по предварительным данным по превышение
среднероссийского показателя заболеваемости в Российской Федерации отмечено в
регионах: Кемеровская (зарегистрировано 124,4 новых случаев ВИЧ-инфекции на 100 тыс. населения), Самарская (123,9), Иркутская (115,6), Свердловская (115,5), Новосибирская (102,5), Ханты-Мансийский автономный
округ (100,4), Ленинградская (90,4), Тюменская (82,8), Пермский край (82,3), Ульяновская (67,3), Челябинская
(65,6), Санкт-Петербург (64,4), Оренбургская (63,8) области, Алтайский край (63,3), Красноярский край (56,7), Курганская (54,9), Тверская (54,0), Ивановская (50,9) области, Республика Бурятия (46,0), Калининградская область (45,0), Республика Башкортостан (42,1), Омская область (41,9).
Среди федеральных округов по
показателю заболеваемости лидируют Уральский
федеральный округ (87,5) и Сибирский федеральный округ (73,2).
>>- - Читать полностью -->>
Тэги: 2011, aid, hiv, russia, statistic, статистика
Как изучать R? 2011-05-08 21:37:00
... Modern Applied Statistics with S (Statistics and Computing ... with R (Statistics and Computing): книга ...
+ развернуть текст сохранённая копия
На сайте R-сообщества Insider-R, сотрудник компании Revolution Analytics Джозеф Рикерт (Joseph Ricker) поделился своим видением того, как стоит изучать язык статистических вычислений R (подробнее см. здесь). Джозеф считает, что процесс изучения R можно разделить на следующие пять стадий: - Поверхностное понимание культуры R-сообщества и программной среды, в которой функционирует и разрабатывается язык R. Знакомство с имеющимися вспомогательными ресурсами. Инсталляция R на компьютере пользователя и выполнение первых тестовых скриптов.
- Считывание данных из csv-файлов и уверенное использование R-функций для выполнения привычного пользователю статистического анализа.
- Использование базовых структур языка R для написания простых программ. Написание собственных функций. Ознакомление со структурами данных, с которыми может работать R. Ознакомление с более сложными возможностями языка. Работа с базами данных, веб-страницами и внешними источниками данных.
- Написание сложных программ на языке R. Самостоятельная разработка и глубокое понимание структуры объектов S3- и S4-класса.
- Разработка профессиональных программ на языке R. Самостоятельное создание дополнительных модулей-библиотек для R.
Стадия 1, как считает Джозеф, может быть пройдена менее чем за день, особенно при наличии хорошего вводного учебника. Преодоление стадий 2 и 3 потребует регулярной работы с R. Большинство рядовых пользователей R остановятся за стадии 3, т.к. полученных к этому времени знаний им будет вполне достаточно для выполнения рутинных статистических задач. Начинать изучение R рекомендуется с ознакомления с содержанием таких сайтов, как Inside-R, CRAN (хранилище R-библиотек) и Сrantastic. Для удобной работы стоит инсталлировать какую-либо из имеющихся интегрированных сред разработки (IDE) для R с графическим пользовательским интерфейсом. Отличным вариантом является использование IDE от компании Revolution Analytics, однако ее бесплатная версия доступна лишь для сотрудников академических учреждений. Другим хорошим вариантом является бесплатная RStudio. Основные образовательные ресурсы для изучения R можно разделить на три группы: - Книги, статьи, презентации, и другие подобные материалы
- Блоги
- Специальные курсы по R
Книги Большинство книг по R выпускаются тремя основными издетальствами - Springer, Cambridge University Press и Chapman & Hall / CRC (см., например, почти исчерпывающий список книг здесь). Так, Springer издает целую серию (Use-R) отличных и относительно недорогих по стоимости вводных пособий. Дж. Рикерт советует несколько литературных источников, на которые стоит обратить особое внимание в ходе изучения R: - Dalgaard P (2004) Introductory Statistics with R: книга особенно хороша для тех, кто приступает к изучению не только языка R, но и статистики в целом
- Fox J (2010) An R and S-Plus Companion to Applied Regression: книга о регрессионных моделях; написана на том же доступном уровне, что и предыдущая
- J Maindonald, JW Braun (2010) Data Analysis and Graphics Using R: An Example-based Approach: несколько более сложно написанная книга, которая, тем не менее, дает широкий обзор статистических методов, реализуемых при помощи R, и имеет множество примеров
- Gelman A, Hill J (2006) Data Analysis Using Regression and Multilevel / Hierarchical Models: книга о регрессионном анализе, включая модели со смешанными эффектами
- Venables VN, Ripley BD (2010) Modern Applied Statistics with S (Statistics and Computing): книга, которая должна быть настольной у каждого аналитика, профессионально использующего R
- Spector P (2008) Data Manipulation with R: краткое, но очень полезное введение в структуры данных R и основные команды, используемые для управления данными
- Adler J (2010) R in a Nutshell: вводное пособие по R
- Teetor P (2011) R Cookbook: как следует из названия, это - сборник "R-рецептов"; полезная и очень практичная книга
- Muenshen RA (2008) R for SAS and SPSS Users: эта книга достойна стать настольной для пользователей, хорошо владеющих SAS и/или SPPS, и желающих перети на работу с R
- Chamber J (2010) Software for Data Analysis: Programming with R (Statistics and Computing): книга рассматривает технические особенности языка R и будет полезна для профессиональных программистов
К сожалению, на русском языке на данный момент не опубликовано ни одной полноценной книги по R. Полезными вводными пособиями могут оказаться серия статей в журнале Linux Format (pdf-файлы статей можно скачать здесь), а также методические рекомендации к лабораторным работам по курсу "Машинное обучение", который предподают на Факультете вычислительной математики и кибернетики Нижегородского университета.
Блоги Помимо книг и сопровождающих их веб-сайтов, отличным источником интересных и полезных примеров R-кода являются блоги. Дж. Рикерт рекомендует обратить особое внимание на блог Дэвида Смита (David Smith, сотрудник Revolution Analytics), а также на Quick R, R-Bloggers и блог Роба Хиндмана (Rob Hyndman). Русскоязычные блоги о R на данный момент весьма немногочисленны. Тем не менее, в сообщениях имеющихся блогов также можно найти много полезной информации, особенно здесь: - Сообщество r-statistics в Live Journal (куратор - Александр Виноградов)
- Блог Ришата Габидуллина (Voliadis place)
- Блог Андрея Четверикова (http://chetvericov.ru/tag/r/)
- Блог "R по-русски"
Специальные курсы по RЕсли Вам позволяют финансовые возможности, Вы можете пройти специальные курсы по R, вроде тех, что предлагают на сайте statistics.com, и получить официальный сертификат. Обучение, как недтрудно догадаться, происходит на английском языке. Насколько мне известно, подобных курсов на русском языке пока не существует.
Тэги: analytic, bloggers, cran, crantastic, format, inside, linux, quick, revolution, rstudio, statistic, use
Москва, заболеваемость ВИЧ, альтернативное мнение. 2011-05-07 10:12:00
+ развернуть текст сохранённая копия
Москва. 3 сентября. Interfax.Ru Руководитель Московского городского центра профилактики и борьбы со СПИД Департамента здравоохранения Москвы Алексей Мазус рассказал «Интерфаксу» о ситуации с заболеваемостью ВИЧ-инфекцией в столице и поделился своими оценками решения данной проблемы в стране.
— В Москве из-за густонаселенности любой вирус может оказаться особенно губительным. Скажите, каков сегодня в столице уровень заболеваемости СПИД?
— С начала регистрации ВИЧ-инфекции в городе (1987 г.) по состоянию на 1 сентября текущего года выявлено 56.007 случаев заражения ВИЧ, среди них 34.731 — у москвичей. Уровень заболеваемости ВИЧ-инфекцией в Москве в 2008–2009 гг. удерживался на сравнительно низком уровне. Показатель прироста ВИЧ-инфицированных по сравнению с 2009 г. составил 4,6%, что в почти в 2 раза ниже аналогичного показателя для Западной и Центральной Европы. Сравнение эпидемиологических показателей в Москве и столицах европейских государств показывает, что обстановка в нашей столице намного благоприятнее, чем, скажем, в Париже, Лондоне или Берлине. Пораженность жителей в Вашингтоне почти в 10(!) раз больше, чем в Москве. В общем, можно сказать, что столица России сегодня — самый безопасный город в Европе в плане ВИЧ-инфекции.
>>- - Читать полностью -->>
Тэги: aid, hiv, mazus, moscow, statistic
Главная / Главные темы / Тэг «statistics»
|
Взлеты Топ 5
Падения Топ 5
|