• 7. Основна хардуерна конфигурация на персонален компютър. Системна единица: понятия, видове. Вътрешната структура на системния блок.
  • 8. Платка на измервателния компютър: концепция, предназначение, характеристики, логически схеми.
  • 9. Структура и основни характеристики на процесора като основна микросхема на компютъра Комуникация на процесора с други устройства. Компоненти на основната линия на компютъра.
  • 10. Вътрешна компютърна памет: RAM и кеш памет, ROM микросхема и BIOS система, енергонезависима CMOS памет. Външен носител и устройства за съхранение.
  • 11. Дизайн, принцип на действие, основни параметри на твърдия диск.
  • 1. Протокол за пренос на данни.
  • 12. Класификация на входни и изходни устройства, портове на компютъра за свързване на периферни устройства.
  • 13. Видове и основни потребителски характеристики на съвременните монитори.
  • 14. Принтери: концепция, предназначение, видове, принципи на работа.
  • 15. Клавиатура: групи ключове, присвояване на клавиши.
  • 16. Видове, принцип на действие, регулируеми параметри на мишката. Добавяне. Comp-pa устройства: модем, телевизионен тунер, звукова карта.
  • 17. Понятие и структура на софтуера за персонален компютър.
  • 18. Предназначение, видове, водещи функции на операционната система PC. Основните компоненти на операционната система: ядро, интерфейс, драйвери на устройства.
  • 19. Понятие и видове файлове. Файловата структура на компютъра. Поддръжка на файловата структура на персонален компютър.
  • 20. Приложен софтуер: концепция, значение, структура, видове, програми.
  • 21. Предназначение и видове езици за програмиране. Компоненти на системата за програмиране.
  • 22. Предназначение и класификация на сервизния софтуер.
  • 23. Компютърен вирус. Признаци на вирусна инфекция.
  • 24. Класификация на вирусите.
  • 25. Видове антивирусни програми. Мерки за защита на компютрите от вируси.
  • 26. Концепцията за архивиране. Методи и формати за компресиране на информация. Основни идеи за алгоритми rle, Lempel-Ziv, Huffman.
  • 27. База данни. Класификация. Модели на база данни. Предимства и недостатъци.
  • 28. Подп. Видове. Основни принципи на създаването.
  • 29. Автоматизирано работно място на медицински специалист. Предназначение, основни изисквания и принципи на развитие.
  • 30. Наборът от задачи, решени с помощта на ръката и основните насоки за използване на автоматизирани работни станции от медицински персонал
  • 31. Структурни компоненти и функционални модули на автоматизирани работни станции на медицински работници. Класификация на автоматизирани работни места за служители на медицински организации.
  • 32. Знанията като основа за функционирането на експертни системи. Понятие, свойства и видове знания.
  • 33. Експертна система: концепция, предназначение и структурни компоненти. Основните етапи от разработването на експертна система
  • 34. Основни функции на експертни системи и изисквания за работата на медицински експертни системи.
  • 35. Режими на функциониране и видове съвременни експертни системи. Експертна система и специалист: сравнителни предимства и недостатъци
  • 36. Понятието за компютърна мрежа. Основни изисквания към съвременните компютърни мрежи
  • 37. Основните компоненти на компютърната мрежа
  • 38. Класификация на компютърните мрежи. Топология ks. Видове. Предимства и недостатъци.
  • 39. Глобален Интернет. История на създаването. Общи характеристики на Интернет. Принцип на превключване на пакети
  • 40. Интернет протокол. Мрежови възможности. „Световната мрежа“. Html език.
  • 41. Телемедицина, задачи на телемедицината. История на развитието. Основните насоки на телемедицината
  • 42. Предмет, цели и задачи на медицинската информатика. Видове медицинска информация
  • 43. Класификация на медицинските информационни системи (MIS). Мисионни задачи
  • 44. Информационни технологии. Информационни системи
  • 45. Видове технологични информационни медицински системи. Мис нива на развитие
  • 46. \u200b\u200bИсторията на развитието на компютрите. Поколения компютри. Настоящият етап от развитието на изчислителната технология и нейните перспективи
  • 47. Математическа статистика, нейните методи. Основните етапи на статистическата работа.
  • 48. Обща популация и извадка. Методи за вземане на проби
  • 49. Вариационна поредица и нейното визуално представяне. Изграждане на хистограма (алгоритъм)
  • 50. Характеристики на статистическото разпределение: характеристики на позицията; характеристики на формата; характеристики на разсейване.
  • 51. Оценка на параметрите на генералната съвкупност. Оценка на точка и интервал. Доверителен интервал. Ниво на значимост
  • 52. Дисперсионен анализ. Класиране и анализ на фактори. Най-простата схема на вариация с разлики в един фактор
  • 53. Дисперсионен анализ. Работна формула за изчисляване на средни квадрати
  • 54. Изчисляване на f-критерия за определяне влиянието на изследвания фактор. Количествено определяне на влиянието на отделни фактори.
  • 55. Понятието за корелация. Функционална и корелационна зависимост. Скатерни сюжети.
  • 56. Коефициент на корелация и неговите свойства.
  • 57. Регресионен анализ. Линейна регресия
  • 58. Редове на динамиката. Концепция за времеви редове. Типове редове. Определяне на тенденция
  • 59. Подравняване на времевите редове: метод на пълзяща средна стойност
  • 60. Изравняване на времевите редове: метод на най-малките квадрати
  • 61. Изравняване на времевите редове: метод за удължаване на периода
  • 62. Анализ на времеви редове. Хронологична средна стойност. Абсолютното увеличение на броя. Темп на растеж
  • 63. Анализ на времеви редове. Хронологична средна стойност. Темп на растеж. Темп на нарастване
  • 47. Математическа статистика, нейните методи. Основните етапи на статистическата работа.

    Математическата статистика е научна дисциплина, предмет на която е разработването на методи за регистрация, описание и анализ на статистически експериментални данни, получени в резултат на наблюдения на масивни случайни явления.

    Основните задачи математическа статистика са:

      определяне на закона за разпределение на случайна променлива или система от случайни променливи;

      тестване на правдоподобността на хипотезите;

      определяне на неизвестни параметри на разпределение.

    Всички методи на математическата статистика се основават на теорията на вероятността. Въпреки това, поради спецификата на решаваните задачи, математическата статистика се откроява от теорията на вероятността в независима област. Ако в теорията на вероятността моделът на явлението се счита даден и се изчислява възможният реален ход на това явление (фиг. 1), то в математическата статистика се избира подходящ теоретично-вероятностен модел въз основа на статистически данни (фиг. 2).

    Фиг. 1. Общ проблем на теорията на вероятностите

    Фиг. 2. Общ проблем на математическата статистика

    Като научна дисциплина математическата статистика се развива заедно с теорията за вероятността. Математическият апарат на тази наука е построен през втората половина на 19 век.

    Основните етапи на статистическата работа.

    Всяко статистическо проучване се състои от 3 основни етапа:

      събирането е масивно научно организирано наблюдение, чрез което се получава първична информация за отделни факти (единици) на изследваното явление. Това статистическо отчитане на голям брой или на всички единици, включени в изследваното явление, е информационна база за статистически обобщения, за формулиране на заключения за изследваното явление или процес;

      групиране и обобщение. Тези данни се разбират като разпределение на набор от факти (единици) в еднородни групи и подгрупи, окончателното преброяване за всяка група и подгрупа и представяне на получените резултати под формата на статистическа таблица;

      обработка и анализ. Статистическият анализ завършва етапа на статистическите изследвания. Съдържа обработката на статистически данни, получени по време на обобщението, интерпретация на получените резултати с цел получаване на обективни изводи за състоянието на изследваното явление и моделите на неговото развитие.

    48. Обща популация и извадка. Методи за вземане на проби

    Общо население (на английски - население) - съвкупността от всички обекти (единици), спрямо които ученият възнамерява да направи изводи, когато изучава конкретен проблем.

    Общото население се състои от всички обекти, които подлежат на проучване. Състав общото население зависи от целите на изследването. Понякога общото население е цялото население на определен регион (например, когато се изследва отношението на потенциалните избиратели към даден кандидат), най-често се задават няколко критерия, които определят обекта на изследване. Например мъже на възраст 30-50 години, които използват определена марка самобръсначка поне веднъж седмично и имат доход от поне $ 100 на член на семейството.

    Проба или популация от проби - съвкупност от случаи (субекти, обекти, събития, проби), използвайки определена процедура, избрана от общата популация за участие в изследването.

    Характеристики на пробата:

      Качествени характеристики на извадката - кого точно избираме и какви методи за изграждане на пробата използваме за това

      Количествени характеристики на извадката - колко случаи избираме, с други думи, размерът на извадката.

    Необходимост от вземане на проби

      Изследователският обект е много обширен. Например потребителите на продуктите на глобална компания са огромен брой географски разпръснати пазари.

      Необходимо е да се събира първична информация.

    Размер на пробата

    Размер на извадката - броят на случаите, включени в извадката. По статистически причини се препоръчва броят на случаите да бъде поне 30 - 35.

    Основни методи за вземане на проби

    Вземането на проби се основава предимно на познаването на схемата за вземане на проби, което се разбира като списък на всички единици от популацията, от които се избират мерните единици. Например, ако разглеждаме всички сервизи за автосервизи в град Москва като съвкупност, тогава трябва да имаме списък на такива работилници, разглеждани като контур, в рамките на който се формира извадката.

    Контурът за вземане на проби неизбежно съдържа грешка, наречена грешка на контура за вземане на проби, която характеризира степента на отклонение от истинския размер на популацията. Очевидно няма пълен официален списък на всички автосервизи в Москва. Изследователят трябва да информира клиента за работата за размера на грешката на контура на вземане на проби.

    При формирането на извадката се използват вероятностни (случайни) и невероятни (неслучайни) методи.

    Ако всички единици на извадката имат известен шанс (вероятност) да бъдат включени в извадката, тогава пробата се нарича вероятностна. Ако тази вероятност е неизвестна, тогава пробата се нарича невероятна. За съжаление, в повечето маркетингови проучвания, поради невъзможността за точно определяне на размера на популацията, не е възможно да се изчислят точно вероятностите. Следователно терминът „известна вероятност“ се основава на използването на специфични техники за вземане на проби, а не на знанието за точния размер на популацията.

    Вероятностните методи включват:

      прост произволен избор;

      систематичен подбор;

      избор на клъстер;

      стратифициран подбор.

    Невероятни методи:

      подбор въз основа на принципа на удобство;

      подбор въз основа на преценки;

      вземане на проби по време на проучването;

      вземане на проби въз основа на квоти.

    Смисълът на метода за подбор, основан на принципа на удобство, се крие във факта, че вземането на проби се извършва по най-удобния начин от гледна точка на изследователя, например от гледна точка на минималния разход на време и усилия, от гледна точка на наличността на респондентите. Изборът на мястото на изследване и състава на пробата се извършва субективно, например проучването на клиентите се извършва в магазин, най-близък до местоживеенето на изследователя. Очевидно много представители на населението не участват в проучването.

    Вземането на проби въз основа на преценка се основава на използването на мнението на квалифицирани специалисти, експерти относно състава на пробата. Въз основа на този подход често се формират фокусни групи.

    Вземането на проби в процеса на анкетиране се основава на разширяване на броя на респондентите въз основа на предложенията на респонденти, които вече са участвали в анкетата. Първоначално изследователят формира извадка, много по-малка от тази, необходима за изследването, след което тя се разширява, докато се извършва.

    Формирането на извадка въз основа на квоти (избор на квоти) предполага предварително, въз основа на целите на изследването, определяне на броя на групите респонденти, които отговарят на определени изисквания (характеристики). Например за целите на изследването беше решено петдесет мъже и петдесет жени да бъдат интервюирани в универсален магазин. Интервюиращият провежда проучване, докато не избере определена квота.

    Методи на математическата статистика


    1. Въведение

    Математическата статистика е наука, която се занимава с разработването на методи за получаване, описване и обработка на експериментални данни с цел изучаване на моделите на случайни масови явления.

    В математическата статистика могат да се разграничат две области: описателна статистика и индуктивна статистика (статистически извод). Описателната статистика се занимава с натрупването, систематизирането и представянето на експериментални данни в удобна форма. Индуктивната статистика, базирана на тези данни, позволява да се направят определени заключения относно обектите, за които се събират данни, или оценки на техните параметри.

    Типичните области на математическата статистика са:

    1) теория за вземане на проби;

    2) теория на оценките;

    3) тестване на статистически хипотези;

    4) регресионен анализ;

    5) анализ на дисперсията.

    Математическата статистика се основава на редица основни понятия, без които е невъзможно да се изучава съвременни методи обработка на експериментални данни. Сред първите от тях е концепцията за генералната съвкупност и извадката.

    При масовото промишлено производство често е необходимо, без да се проверява всеки произведен продукт, да се установи дали качеството на продукта отговаря на стандартите. Тъй като броят на произведените продукти е много голям или проверката на продуктите е свързана с неговото неизползване, се проверява малък брой продукти. Въз основа на тази проверка трябва да се направи заключение за цялата продуктова серия. Разбира се, не може да се каже, че всички транзистори от партида от 1 милион парчета са добри или лоши, като се провери един от тях. От друга страна, тъй като процесът на вземане на проби за тестване и самото тестване може да отнеме много време и да струва скъпо, обхватът на проверката на продукта трябва да бъде такъв, че да може да осигури надеждно представяне на цялата партида продукти, като същевременно е минималният размер. За тази цел ще въведем редица понятия.

    Цялата съвкупност от изследвани обекти или експериментални данни се нарича генерална съвкупност. Ще обозначим с N броя на обектите или количеството данни, които съставляват генералната съвкупност. Стойността N се нарича обем на генералната съвкупност. Ако N \u003e\u003e 1, т.е. N е много голям, тогава обикновено се разглежда N \u003d ¥.

    Случайна извадка или просто извадка се нарича част от общата популация, произволно избрана от нея. Думата "на случаен принцип" означава, че вероятностите за избор на обект от общата съвкупност са еднакви. Това е важно предположение, но често е трудно да се тества на практика.

    Размерът на извадката е броят на обектите или количеството данни, които съставляват извадката, и е н ... По-нататък ще приемем, че на елементите на извадката могат да се присвоят съответно числови стойности x 1, x 2, ... x n. Например, в процеса на контрол на качеството на произведените биполярни транзистори, това може да бъде измерване на тяхното DC усилване.


    2. Числени характеристики на пробата

    2.1 Примерна средна стойност

    За конкретна проба с размер n, нейната извадка е средна

    се определя от съотношението

    където x i е стойността на примерните елементи. Обикновено искате да опишете статистическите свойства на случайни извадки, а не на едно от тях. Това означава, че обмисляме математически модел, който приема достатъчно голям брой проби с размер n. В този случай елементите на извадката се разглеждат като случайни променливи X i, като приемат стойности x i с плътност на вероятността f (x), която е плътността на вероятността за общата популация. Тогава средната стойност на пробата също е случайна променлива

    равен

    Както и преди, ще обозначаваме случайни променливи с главни букви, а стойностите на случайни променливи - с малки букви.

    Средната стойност на генералната съвкупност, от която е направена извадката, ще се нарича обща средна стойност и се обозначава с m x. Може да се очаква, че ако размерът на извадката е значителен, тогава средната стойност на извадката няма да се различава значително от общата средна стойност. Тъй като средната стойност на извадката е случайна променлива, математическото очакване може да бъде намерено за нея:

    По този начин математическото очакване на средната стойност на пробата е равно на общата средна стойност. В този случай се смята, че примерната средна стойност е обективната оценка на общата средна стойност. По-късно ще се върнем към този термин. Тъй като средната стойност на извадката е случайна променлива, която се колебае около общата средна стойност, желателно е да се оцени тази колебание, като се използва вариацията на средната стойност на пробата. Помислете за извадка, чийто размер n е значително по-малък от размера на общата популация N (n<< N). Предположим, что при формировании выборки характеристики генеральной совокупности не меняются, что эквивалентно предположению N = ¥. Тогда

    Случайните променливи X i и X j (i¹j) могат да се считат за независими, следователно,

    Заместете този резултат във формулата на дисперсията:

    където s 2 е дисперсията на генералната съвкупност.

    От тази формула следва, че с увеличаване на размера на извадката, колебанията на пробата означават около общото средно намаление като s 2 / n. Нека илюстрираме това с пример. Нека има случаен сигнал със съответно математическо очакване и дисперсия, равна на m x \u003d 10, s 2 \u003d 9.

    Пробите на сигнала се вземат при равно разстояние от времена t 1, t 2, ...,

    X (t)

    X 1

    t 1 t 2. ... ... т н т

    Тъй като извадките са случайни променливи, ще ги обозначим с X (t 1), X (t 2) ,. ... ... , X (t n).

    Нека определим броя на броя, така че стандартното отклонение на оценката на математическото очакване на сигнала да не надвишава 1% от неговото математическо очакване. Тъй като m x \u003d 10, е необходимо това

    От друга страна, следователно, или От това получаваме, че n ³ 900 проби.

    2.2 Дисперсия на пробата

    За данните от пробата е важно да се знае не само средната стойност на пробата, но и разпространението на стойностите на пробата около средната стойност на пробата. Ако средната стойност на извадката е оценка на общата средна стойност, тогава дисперсията на пробата трябва да бъде оценка на общата дисперсия. Дисперсия на пробата

    за извадка, състояща се от случайни променливи, се определя, както следва

    Използвайки това представяне на дисперсията на извадката, намираме нейното математическо очакване

    * Тази работа не е научна работа, не е окончателна квалификационна работа и е резултат от обработка, структуриране и форматиране на събраната информация, предназначена за използване като източник на материал за самоподготовка на учебната работа.

      Въведение.

      Препратки.

    Методи на математическата статистика

      Въведение.

      Основни понятия за математическа статистика.

      Статистическа обработка на резултатите от психолого-педагогическите изследвания.

      Препратки.

    Методи на математическата статистика

      Въведение.

      Основни понятия за математическа статистика.

      Статистическа обработка на резултатите от психолого-педагогическите изследвания.

      Препратки.

        Въведение.

    Прилагането на математиката към други науки има смисъл само във връзка с дълбока теория на конкретно явление. Важно е да запомните това, за да не се изгубите в проста игра на формули, зад която няма реално съдържание.

    Академик Ю.А. Митрополит

    Теоретичните изследователски методи в психологията и педагогиката позволяват да се разкрият качествените характеристики на изследваните явления. Тези характеристики ще бъдат по-пълни и по-дълбоки, ако натрупаният емпиричен материал бъде подложен на количествена обработка. Проблемът с количествените измервания в рамките на психолого-педагогическите изследвания обаче е много сложен. Тази сложност се крие преди всичко в субективно-причинното разнообразие на педагогическата дейност и нейните резултати, в самия обект на измерване, който е в състояние на непрекъснато движение и промяна. В същото време въвеждането на количествени показатели в изследването днес е необходим и задължителен компонент за получаване на обективни данни за резултатите от педагогическата работа. По правило тези данни могат да бъдат получени както чрез пряко или косвено измерване на различни компоненти на педагогическия процес, така и чрез количествена оценка на съответните параметри на адекватно изградения му математически модел. За тази цел при изучаването на проблемите на психологията и педагогиката се използват методи на математическа статистика. С тяхна помощ се решават различни задачи: обработка на фактически материал, получаване на нови, допълнителни данни, обосноваване на научната организация на изследването и други.

    2. Основни понятия за математическа статистика

    Изключително важна роля в анализа на много психологически и педагогически явления играят средните стойности, които са обобщена характеристика на качествено хомогенна популация според определен количествен критерий. Невъзможно е например да се изчисли вторичната специалност или средната националност на студентите, тъй като това са качествено разнородни явления. Но е възможно и е необходимо да се определят средно числените характеристики на академичните им резултати (среден резултат), ефективността на методологичните системи и техники и т.н.

    В психологическите и педагогическите изследвания обикновено се използват различни видове средни стойности: средна аритметична, средна геометрична, медиана, мода и други. Най-често срещаните са средно аритметично, медиана и режим.

    Средната аритметична стойност се използва в случаите, когато има пряко пропорционална връзка между определящото свойство и дадения атрибут (например, с подобрение в работата на изследваната група, ефективността на всеки от нейните членове се подобрява).

    Средната аритметична стойност е коефициентът на разделяне на сумата на количествата на техния брой и се изчислява по формулата:

    където X е средната аритметична стойност; X1, X2, X3 ... Xn - резултатите от отделни наблюдения (техники, действия),

    n е броят на наблюденията (техники, действия),

    Сумата от резултатите от всички наблюдения (техники, действия).

    Медианата (Me) е мярка за средната позиция, която характеризира стойността на характеристика в подредена (изградена въз основа на увеличаване или намаляване) скала, която съответства на средата на изследваната популация. Медианата може да се определи за редови и количествени характеристики. Местоположението на тази стойност се определя по формулата: Местоположение на медианата \u003d (n + 1) / 2

    Например. Проучването установи, че:

    - 5 души от участие в експериментално проучване с отлични оценки;

    - 18 души учат „добре“;

    - за „задоволителен“ - 22 души;

    - „незадоволително“ - 6 души.

    Тъй като в експеримента са участвали N \u003d 54 души, средата на извадката е равна на хората. Следователно се стига до заключението, че повече от половината от учениците учат под оценката „добро“, т.е. медианата е по-„задоволителна“, но по-малка от „добра“ (вж. Фигурата).

    Режим (Mo) е най-често срещаната типична стойност на дадена характеристика сред другите стойности. Съответства на класа с максимална честота. Този клас се нарича модална стойност.

    Например.

    Ако на въпроса на въпросника: „посочете степента на владеене на чужд език“, отговорите бяха разпределени:

    1 - говорете свободно - 25

    2 - Говоря достатъчно, за да общувам - 54

    3 - Знам как, но имам затруднения в комуникацията - 253

    4 - едва ли разбирам - 173

    5 - не говори - 28

    Очевидно най-типичното значение тук е „притежавам, но изпитвам затруднения в комуникацията“, което ще бъде модално. Така че модът е - 253.

    Когато се използват математически методи в психологическите и педагогическите изследвания, голямо значение се отдава на изчисляването на дисперсията и средноквадратичните (стандартни) отклонения.

    Дисперсията е равна на средния квадрат на отклоненията на стойността на опциите от средната стойност. Той действа като една от характеристиките на отделните резултати от разсейването на стойностите на изследваната променлива (например оценки на учениците) около средната стойност. Дисперсията се изчислява чрез определяне на: отклонението от средната стойност; квадратът на определеното отклонение; сумата от квадратите на отклонението и средната стойност на квадрата на отклонението (вж. таблица 6.1).

    Стойността на дисперсията се използва при различни статистически изчисления, но не се наблюдава пряко. Количеството, пряко свързано със съдържанието на наблюдаваната променлива, е стандартното отклонение.

    Таблица 6.1

    Пример за изчисление на дисперсията

    Стойност

    индикатор

    Отклонение

    от средно

    отклонения

    2 – 3 = – 1

    Средното квадратно отклонение потвърждава типичността и експоненциалността на средната аритметична стойност, отразява мярката на колебанията в числените стойности на признаците, от които се извежда средната стойност. Той е равен на квадратния корен от дисперсията и се определя по формулата:

    където: - среден квадратен квадрат. С малък брой наблюдения (действия) - по-малко от 100 - в стойността на формулата трябва да се постави не „N“, а „N - 1“.

    Аритметичната средна стойност и средният квадратен квадрат са основните характеристики на резултатите, получени по време на изследването. Те ви позволяват да обобщавате данни, да ги сравнявате, да установявате предимствата на една психологическа и педагогическа система (програма) пред друга.

    Средното квадратно (стандартно) отклонение се използва широко като мярка за дисперсия за различни характеристики.

    Когато се оценяват резултатите от изследването, е важно да се определи дисперсията на случайна величина около средната стойност. Това разсейване е описано с помощта на закона на Гаус (законът за нормалното разпределение на вероятността за случайна променлива). Същността на закона е, че при измерване на определена характеристика в даден набор от елементи винаги има отклонения в двете посоки от нормата поради множество неконтролируеми причини, а колкото по-големи са отклоненията, толкова по-рядко се появяват.

    По-нататъшната обработка на данните може да разкрие: коефициент на вариация (стабилност) изследваното явление, което е процентът на стандартното отклонение към средната аритметична стойност; мярка за наклон, показващи в коя посока е насочен преобладаващият брой отклонения; мярка за прохлада, който показва степента на натрупване на стойности на случайна величина около средната стойност и др. Всички тези статистически данни помагат за по-пълно идентифициране на признаците на изследваните явления.

    Мерки за свързване между променливи. Извикват се връзки (зависимости) между две или повече променливи в статистиката корелация. Оценява се, като се използва стойността на коефициента на корелация, който е мярка за степента и величината на тази връзка.

    Има много коефициенти на корелация. Нека разгледаме само част от тях, които отчитат наличието на линейна връзка между променливите. Изборът им зависи от скалите на измерване на променливите, връзката между които трябва да бъде оценена. Най-често използваните в психологията и педагогиката са коефициентите на Пиърсън и Спиърман.

    Нека разгледаме изчисляването на стойностите на коефициентите на корелация, като използваме конкретни примери.

    Пример 1. Нека две съпоставими променливи X (семейно положение) и Y (изключване от университета) се измерват на дихотомична скала (специален случай на деноминационната скала). За да определим връзката, използваме коефициента на Пиърсън.

    В случаите, когато не е необходимо да се изчислява честотата на поява на различни стойности на променливите X и Y, е удобно да се изчисли коефициентът на корелация, като се използва таблица за непредвидени обстоятелства (виж таблици 6.2, 6.3, 6.4), показваща броя на съвместните появявания на двойки стойности за две променливи (характеристики) ... A - броят на случаите, когато променливата X има стойност, равна на нула, и в същото време променливата Y има стойност, равна на единица; B - броят на случаите, когато променливите X и Y имат едновременно стойности, равни на единица; С - броят на случаите, когато променливите X и Y имат едновременно стойности, равни на нула; D - броят на случаите, когато променливата X има стойност, равна на единица, и в същото време променливата Y има стойност, равна на нула.

    Таблица 6.2

    Обща непредвидена таблица

    Функция X

    По принцип формулата за коефициента на корелация на Пиърсън за дихотомични данни е

    Таблица 6.3

    Примерни данни в дихотомен мащаб

    Нека заместим данните от таблицата за непредвидени обстоятелства (виж Таблица 6.4), съответстващи на разглеждания пример, във формулата:

    По този начин коефициентът на корелация на Пиърсън за избрания пример е 0,32, тоест връзката между семейното положение на студентите и фактите за изключване от университета е незначителна.

    Пример 2. Ако и двете променливи се измерват в скали от порядък, тогава коефициентът на корелация на ранга на Спирман (Rs) се използва като мярка за връзката. Изчислява се по формулата

    където Rs е коефициент на рангова корелация на Спирман; Di е разликата в редиците на сравняваните обекти; N е броят на сравняваните обекти.

    Стойността на коефициента на Спирман варира от –1 до + 1. В първия случай има еднозначна, но противоположно насочена връзка между анализираните променливи (с увеличаване на стойността на едната, стойността на другата намалява). Във втората, с нарастването на стойностите на една променлива, стойността на втората променлива се увеличава пропорционално. Ако стойността на Rs е равна на нула или има стойност, близка до нея, тогава няма значителна връзка между променливите.

    Като пример за изчисляване на коефициента на Спирман използваме данните от таблица 6.5.

    Таблица 6.5

    Данни и междинни резултати от изчисляването на стойността на коефициента

    ранг корелация Rs

    Качества

    Експертни класи

    Разлика в ранга

    Ранкова разлика на квадрат

    –1
    –1
    –1

    Сумата от квадратите на ранг разликите Di \u003d 22

    Нека заместим примерните данни във формулата за коефициента на Смирман:

    Резултатите от изчисленията ни позволяват да твърдим наличието на достатъчно изразена връзка между разглежданите променливи.

    Статистически тест на научна хипотеза. Доказателството за статистическа надеждност на експерименталното влияние се различава значително от доказателството в математиката и формалната логика, където заключенията са по-универсални по своя характер: статистическите доказателства не са толкова строги и окончателни - те винаги рискуват да допуснат грешки в заключенията и следователно статистическите методи не доказват окончателно легитимността на един или друг заключение и е показана мярка за вероятността от приемане на определена хипотеза.

    Педагогическа хипотеза (научно предположение за предимството на даден метод и т.н.) в процеса на статистическия анализ се превежда на езика на статистическата наука и се формулира наново, поне под формата на две статистически хипотези. Извиква се първият (основен) нулева хипотеза (H 0), в който изследователят говори за своята изходна позиция. Той (априори), като че ли, декларира, че новият (поет от него, негови колеги или опоненти) метод няма никакви предимства и следователно от самото начало изследователят е психологически готов да заеме честна научна позиция: разликите между новия и стария метод са обявени за равни на нула. В друг, алтернативна хипотеза (Н 1) се прави предположение за предимството на новия метод. Понякога се излагат няколко алтернативни хипотези с подходящи обозначения.

    Например хипотезата за предимството на стария метод (H 2). Алтернативни хипотези се приемат, ако и само ако нулевата хипотеза е опровергана. Това се случва в случаите, когато разликите, да речем, в аритметичните средни на експерименталната и контролната групи са толкова значителни (статистически значими), че рискът от грешка при отхвърляне на нулевата хипотеза и приемане на алтернативата не надвишава една от трите приети нива на значимост статистически извод:

    - първото ниво - 5% (в научни текстове понякога пишат p \u003d 5% или a? 0,05, ако са представени на фракции), където рискът от грешка в заключението е разрешен в пет случая от сто теоретично възможни подобни експеримента със строго произволен подбор на субекти за всеки експеримент;

    - второто ниво е 1%, т.е. съответно рискът от грешка е разрешен само в един случай от сто (a? 0,01, със същите изисквания);

    - третото ниво е 0,1%, тоест рискът от грешка е разрешен само в един случай от хиляда (a? 0,001). Последното ниво на значимост поставя много високи изисквания за обосноваване на надеждността на експерименталните резултати и поради това се използва рядко.

    Когато сравняваме средната аритметична стойност на експерименталната и контролната групи, е важно не само да се определи кое средно е по-голямо, но и колко по-голямо. Колкото по-малка е разликата между тях, толкова по-приемлива ще бъде нулевата хипотеза за отсъствието на статистически значими (надеждни) разлики. За разлика от мисленето на нивото на ежедневното съзнание, което е склонно да възприема разликата в средствата, получени в резултат на опит като факт и основа за извод, учител-изследовател, запознат с логиката на статистическото заключение, няма да бърза в такива случаи. Той най-вероятно ще направи предположение за случайността на разликите, ще изложи нулева хипотеза за липсата на значителни разлики в резултатите от експерименталната и контролната групи и едва след опровергаването на нулевата хипотеза ще приеме алтернативата.

    По този начин въпросът за различията в научното мислене се прехвърля в друга равнина. Въпросът не е само в разликите (те почти винаги съществуват), а в големината на тези разлики и оттам в определянето на разликата и границата, след която може да се каже: да, разликите не са случайни, те са статистически значими, което означава, че субектите от тези две групи принадлежат след експериментирайте вече не с една (както преди), а с две различни общи популации и че нивото на подготвеност на учениците, потенциално принадлежащи към тези популации, ще се различава значително. За да покажат границите на тези различия, т.нар оценки на общи параметри.

    Нека да разгледаме конкретен пример (вижте Таблица 6.6), как с помощта на математическа статистика можете да опровергаете или потвърдите нулевата хипотеза.

    Например, необходимо е да се определи дали ефективността на груповите дейности на учениците зависи от нивото на развитие в изследваната група на междуличностните отношения. Като нулева хипотеза се предполага, че такава връзка не съществува и като алтернатива съществува връзка. За тези цели се сравняват резултатите от ефективността на дейността в две групи, едната от които в случая действа като експериментална, а другата като контролна. За да се определи дали разликата между средните стойности на показателите за изпълнение в първата и във втората група е значителна (значителна), е необходимо да се изчисли статистическата значимост на тази разлика. За това можете да използвате t - теста на Student. Изчислява се по формулата:

    където X 1 и X 2 - средната аритметична стойност на променливите в групи 1 и 2; М 1 и М 2 - стойности на средни грешки, които се изчисляват по формулата:

    където е средният квадрат, изчислен по формулата (2).

    Нека определим грешките за първия ред (експериментална група) и втория ред (контролна група):

    Намираме стойността на t - критерия по формулата:

    След като се изчисли стойността на t - критерия, се изисква да се определи нивото на статистическа значимост на разликите между средните показатели за ефективност на активността в експерименталната и контролната групи с помощта на специална таблица. Колкото по-висока е стойността на критерия t, толкова по-голяма е значимостта на разликите.

    За това изчисленото t се сравнява с табличното t. Стойността на таблицата се избира, като се вземе предвид избраното ниво на доверие (p \u003d 0,05 или p \u003d 0,01), а също и в зависимост от броя на степени на свобода, който се намира по формулата:

    където U е броят на степени на свобода; N 1 и N 2 - броят на измерванията в първия и втория ред. В нашия пример U \u003d 7 + 7 –2 \u003d 12.

    Таблица 6.6

    Данни и междинни резултати от изчисляването на значимостта на статистическите данни

    Различия в средните стойности

    Експериментална група

    Контролна група

    Стойността на ефективността на дейността

    За таблицата t - критерий откриваме, че стойността на t таблица. \u003d 3,055 за еднопроцентно ниво (стр

    Учителят-изследовател обаче трябва да помни, че съществуването на статистическата значимост на разликата в средните стойности е важен, но не и единствен аргумент в полза на наличието или отсъствието на връзка (зависимост) между явления или променливи. Следователно е необходимо да се включат други аргументи за количествено или съществено обосноваване на възможна връзка.

    Методи за многомерен анализ на данни. Анализът на връзката между голям брой променливи се извършва с помощта на многомерни методи на статистическа обработка. Целта на използването на такива методи е да направи скритите модели видими, да подчертае най-значимите връзки между променливите. Примери за такива многомерни статистически методи са:

      - факторен анализ;

      - клъстер анализ;

      - дисперсионен анализ;

      - регресионен анализ;

      - скрит структурен анализ;

      - многомерно мащабиране и други.

    Факторен анализ е да се идентифицират и интерпретират фактори. Фактор е обобщена променлива, която ви позволява да свиете част от информацията, тоест да я представите в удобна форма. Например факториалната теория за личността идентифицира редица обобщени характеристики на поведението, които в този случай се наричат \u200b\u200bличностни черти.

    Клъстер анализви позволява да подчертаете водещата характеристика и йерархията на връзките между характеристиките.

    АНОВА - статистически метод, използван за изследване на една или повече едновременно действащи и независими променливи за променливостта на наблюдаваната черта. Неговата особеност се крие във факта, че наблюдаваната характеристика може да бъде само количествена, докато обяснителните характеристики могат да бъдат както количествени, така и качествени.

    Регресионен анализ ви позволява да идентифицирате количествената (числена) зависимост на средната стойност на промените в продуктивния атрибут (обяснен) от промените в един или повече атрибути (обяснителни променливи). По правило този тип анализ се използва, когато се изисква да се установи доколко се променя средната стойност на една характеристика, когато друга характеристика се променя с една.

    Латентен структурен анализ представлява набор от аналитични и статистически процедури за идентифициране на скрити променливи (характеристики), както и вътрешната структура на връзките между тях. Това дава възможност да се изследват проявите на сложни взаимовръзки на пряко ненаблюдаеми характеристики на социално-психологическите и педагогическите явления. Латентният анализ може да бъде основата за моделиране на тези взаимоотношения.

    Многомерно мащабиране осигурява визуална оценка на сходството или разликата между някои обекти, описани от голямо разнообразие от променливи. Тези разлики се представят като разстоянието между оценяваните обекти в многомерно пространство.

    3. Статистическа обработка на резултатите от психолого-педагогическата

    изследвания

    При всяко изследване винаги е важно да се гарантира масата и представителността (представителността) на обектите на изследване. За да разрешат този проблем, те обикновено прибягват до математически методи за изчисляване на минималната стойност на обекти (групи от респонденти), подлежащи на изследване, така че на тази основа да могат да се направят обективни изводи.

    Според степента на пълнота на обхващане на първичните единици статистиката разделя изследванията на непрекъснати, когато се изследват всички единици на изследваното явление, и селективни, ако се изучава само част от интересуващата популация, взети според някакъв критерий. Изследователят не винаги има възможност да изследва целия набор от явления, въпреки че към това винаги трябва да се стреми (няма достатъчно време, средства, необходими условия и т.н.); от друга страна, често непрекъснато проучване просто не се изисква, тъй като заключенията ще бъдат доста точни след изучаване на определена част от първичните единици.

    Теоретичната основа на селективния метод на изследване е теорията на вероятността и закона за големите числа. За да може изследването да има достатъчен брой факти, наблюдения, използвайте таблица с достатъчно голям брой. В този случай от изследователя се изисква да установи величината на вероятността и величината на допустимата грешка. Нека, например, допустимата грешка в заключенията, която трябва да се направи в резултат на наблюдения, в сравнение с теоретичните предположения, не трябва да надвишава 0,05 както в положителната, така и в отрицателната посока (с други думи, можем да сбъркаме не повече от 5 случаи от 100). Тогава според таблицата с достатъчно големи числа (виж таблица 6.7) откриваме, че правилното заключение може да се направи в 9 случая от 10, когато броят на наблюденията е поне 270, в 99 случая от 100 с най-малко 663 наблюдения и т.н. Това означава, че с увеличаване на точността и вероятността, с които възнамеряваме да направим изводи, броят на необходимите наблюдения се увеличава. При психологическите и педагогическите изследвания обаче не бива да бъде прекалено голям. 300-500 наблюдения често са напълно достатъчни за солидни заключения.

    Този метод за определяне на размера на извадката е най-простият. Математическата статистика има и по-сложни методи за изчисляване на необходимите набори от извадки, които са подробно разгледани в специалната литература.

    Съответствието с изискванията за масов характер все още не гарантира надеждността на заключенията. Те ще бъдат надеждни, когато избраните за наблюдение единици (разговори, експеримент и др.) Са достатъчно представителни за изучавания клас явления.

    Таблица 6.7

    Кратка таблица с достатъчно големи числа

    Количеството

    вероятности

    Допустимо

    Представителността на единиците за наблюдение се осигурява предимно чрез техния произволен подбор с помощта на таблици на случайни числа. Да предположим, че се изисква да се определят 20 групи за обучение за провеждане на масов експеримент от наличните 200. За това се съставя списък на всички групи, който е номериран. След това от таблицата на случайните числа се изписват 20 числа, започвайки с определен номер, на определен интервал. Тези 20 произволни числа според спазването на числата определят групите, от които се нуждае изследователят. Случайният подбор на обекти от общата (обща) популация дава основание да се твърди, че резултатите, получени при изследването на извадка от популация от единици, няма да се различават рязко от тези, които биха били налични в случай на изследване на цялата съвкупност от единици.

    В практиката на психологически и педагогически изследвания се използват не само прости произволни селекции, но и по-сложни методи за подбор: стратифициран случаен подбор, многоетапен подбор и др.

    Математическите и статистическите методи за изследване също са средства за получаване на нов фактически материал. За тази цел се използват техники за шаблониране, които увеличават информационния капацитет на въпросника и мащабирането, което дава възможност за по-точна оценка на действията както на изследователя, така и на субектите.

    Везните са възникнали поради необходимостта от обективно и точно диагностициране и измерване на интензивността на определени психологически и педагогически явления. Мащабирането дава възможност за подреждане на явленията, за количествено определяне на всяко от тях, за определяне на по-ниските и по-високите етапи на изследваното явление.

    Така че, когато изучавате когнитивните интереси на слушателите, можете да установите техните граници: много висок интерес - много слаб интерес. Въведете редица стъпки между тези граници, които създават скала на познавателните интереси: много голям интерес (1); голям интерес (2); среден (3); слаб (4); много слаб (5).

    Везни от различен тип се използват в психологически и педагогически изследвания, например,

    а) Триизмерна скала

    Много активен …… .. ………… ..10

    Активен ………………………… 5

    Пасивни… ... ………………… ... 0

    б) Многомерна скала

    Много активен ………………… ..8

    Междинно ………………… .6

    Не е твърде активен ………… ... 4

    Пасивни ……………………… ..2

    Напълно пасивен ………… ... 0

    в) Двустранна скала.

    Много се интересувам от …………… ..10

    Достатъчно се интересувам от ……… ... 5

    Безразличен ……………………… .0

    Не се интересувам от ………………… ..5

    Изобщо няма лихва ……… 10

    Цифровите рейтингови скали дават на всеки елемент конкретно числово обозначение. Така че, когато се анализира отношението на учениците към ученето, тяхната упоритост в работата, желание за сътрудничество и т.н. можете да съставите числена скала въз основа на следните показатели: 1 - незадоволително; 2 - слаб; 3 - средна; 4 е над средното, 5 е много над средното. В този случай скалата приема следната форма (виж Таблица 6.8):

    Таблица 6.8

    Ако числовата скала е биполярна, се използва биполярно подреждане с нулева стойност в центъра:

    Дисциплина Недисциплина

    Произнесени 5 4 3 2 1 0 1 2 3 4 5 Не се произнася

    Скалите за оценяване могат да бъдат нанесени графично. В този случай те изразяват категории във визуална форма. Освен това всяко разделение (стъпка) от скалата се характеризира устно.

    Разглежданите методи играят важна роля при анализа и обобщаването на получените данни. Те дават възможност да се установят различни корелации, корелации между фактите, да се идентифицират тенденции в развитието на психологическите и педагогическите явления. Така че, теорията за групирането на математическата статистика помага да се определи кои факти от събрания емпиричен материал са сравними, на каква основа да ги групирате правилно, каква степен на надеждност ще бъдат те. Всичко това дава възможност да се избегнат произволни манипулации с факти и да се дефинира програма за тяхната обработка. В зависимост от целите и задачите обикновено се използват три вида групировки: типологично, вариационно и аналитично.

    Типологично групиране използва се, когато е необходимо полученият фактически материал да се разбие на качествено хомогенни единици (разпределение на броя на нарушенията на дисциплината между различните категории ученици, разбивка на показателите за изпълнението на техните физически упражнения по години на обучение и др.).

    Ако е необходимо, групирайте материала според стойността на който и да е променящ се (вариращ) атрибут - разбивка на групи студенти по академични постижения, процент на задания, подобни нарушения на установения ред и др. - прилага се групиране на вариации, което дава възможност да се преценява последователно структурата на изследваното явление.

    Аналитичен изглед на групирането помага да се установи връзката между изучаваните явления (зависимостта на степента на подготовка на учениците от различни методи на преподаване, качеството на изпълняваните задачи от темперамента, способностите и др.), тяхната взаимозависимост и взаимозависимост при точно изчисление.

    Важността на работата на изследователя при групирането на събраните данни се доказва от факта, че грешките в тази работа обезценяват най-изчерпателната и смислена информация.

    В момента математическите основи на групирането, типологията, класификацията са получили най-дълбоко развитие в социологията. Съвременните подходи и методи на типологията и класификацията в социологическите изследвания могат успешно да се прилагат в психологията и педагогиката.

    В хода на изследването се използват техники за окончателно обобщаване на данните. Един от тях е техниката на съставяне и изучаване на таблици.

    При съставяне на обобщение на данни за една статистическа величина се формира серия от разпределения (вариационни редове) на стойността на тази величина. Пример за такава поредица (вж. Таблица 6.9) е обобщение на данните за гръдната обиколка на 500 души.

    Таблица 6.9

    Обобщаването на данни за две или повече статистически величини едновременно включва съставянето на таблица за разпределение, която разкрива разпределението на стойностите на една статична величина в съответствие със стойностите, които приемат други величини.

    Като илюстрация е дадена таблица 6.10, съставена въз основа на статистически данни за гръдната обиколка и теглото на тези хора.

    Таблица 6.10

    Обиколката на гърдите в cm

    Таблицата за разпределение дава представа за връзката и връзката, която съществува между двете стойности, а именно: с ниско тегло, честотите са разположени в горната лява четвърт на таблицата, което показва преобладаването на лица с малка гръдна обиколка. Тъй като теглото се увеличава до средна стойност, честотното разпределение се премества в центъра на плочата. Това показва, че хората с тегло по-близко до средното имат гръдна обиколка, която също е близка до средната. С по-нататъшно увеличаване на теглото честотите започват да заемат долната дясна четвърт на плочата. Това показва, че човек с тегло над средното има гръдна обиколка, която също е над средната.

    От таблицата следва, че установената връзка не е строга (функционална), а вероятностна, когато при промени в стойностите на едната величина другата се променя като тенденция, без твърда еднозначна връзка. Подобни връзки и зависимости често се срещат в психологията и педагогиката. В момента те обикновено се изразяват с помощта на корелационен и регресионен анализ.

    Вариационните редове и таблици дават представа за статиката на явлението, докато динамиката може да бъде показана от поредицата на развитие, където първият ред съдържа последователни етапи или интервали от време, а вторият - стойностите на изследваното статистическо количество, получено на тези етапи. Така се разкриват нарастването, намаляването или периодичните изменения на изследваното явление, разкриват се неговите тенденции и модели.

    Таблиците могат да се попълват с абсолютни стойности или обобщени цифри (средни, относителни). Резултатите от статистическата работа - освен таблици, често се изобразяват и графично под формата на диаграми, фигури и пр. Основните начини за графично изобразяване на статистически величини са: методът на точките, методът на прави линии и методът на правоъгълниците. Те са прости и достъпни за всеки изследовател. Техниката на тяхното използване е да се изчертаят координатни оси, да се установи мащаб и да се извлече обозначението на сегменти (точки) по хоризонталната и вертикалната ос.

    Диаграмите, изобразяващи поредицата от разпределение на стойностите на една статистическа величина, позволяват да се нанасят криви на разпределение.

    Графичното представяне на две (или повече) статистически величини дава възможност да се образува определена извита повърхност, наречена повърхност на разпределение. Поредица от разработки в графичния дизайн криви на развитие.

    Графичното представяне на статистическия материал ви позволява да проникнете по-дълбоко в смисъла на цифровите стойности, да уловите техните взаимозависимости и характеристики на изследваното явление, които е трудно да се забележат в таблицата. Изследователят е освободен от работата, която би трябвало да свърши, за да се справи с изобилието от числа.

    Таблиците и графиките са важни, но само първите стъпки в изследването на статистическите величини. Основният метод е аналитичният, опериращ с математически формули, с помощта на които се извеждат т. Нар. „Обобщаващи показатели“, тоест абсолютните стойности, дадени в съпоставим вид (относителни и средни стойности, салда и индекси). Така че, с помощта на относителни стойности (проценти) се определят качествените характеристики на анализираните агрегати (например съотношението на отличниците към общия брой ученици; броят на грешките при работа на сложно оборудване, причинени от психичната нестабилност на учениците, към общия брой грешки и т.н.). Тоест, разкриват се отношенията: част към цялото (специфично тегло), термини към сумата (структура на агрегата), една част от агрегата към другата му част; характеризираща динамиката на всякакви промени във времето и т.н.

    Както можете да видите, дори най-общото разбиране на методите на статистическото смятане предполага, че тези методи имат големи възможности за анализ и обработка на емпиричен материал. Разбира се, математическият апарат може безпристрастно да обработва всичко, което изследователят влага в него, както надеждни данни, така и субективни предположения. Ето защо за всеки изследовател е необходимо перфектно владеене на математическия апарат за обработка на натрупания емпиричен материал в единство с задълбочени познания за качествените характеристики на изследваното явление. Само в този случай е възможно да се избере висококачествен, обективен фактически материал, неговата квалифицирана обработка и да се получат надеждни крайни данни.

    Това е кратко описание на най-често използваните методи за изучаване на проблемите на психологията и педагогиката. Трябва да се подчертае, че нито един от разгледаните методи, взети сам по себе си, не може да претендира за универсалност, за пълна гаранция за обективността на получените данни. По този начин елементите на субективността в отговорите, получени при интервюирането на респондентите, са очевидни. Резултатите от наблюдението по правило не са свободни от субективните оценки на самия изследовател. Данните, взети от различни документи, изискват едновременно проверка на точността на тази документация (особено лични документи, документи втора ръка и т.н.).

    Следователно всеки изследовател трябва да се стреми, от една страна, да подобри техниката за прилагане на който и да е специфичен метод, а от друга, към сложно, взаимно контролиращо използване на различни методи за изследване на един и същ проблем. Притежаването на цялата система от методи дава възможност да се разработи рационална методология за изследване, ясно да се организира и проведе и да се получат значителни теоретични и практически резултати.

      Препратки.

      Шевандрин Н.И. Социална психология в образованието: Учебник. Част 1. Концептуални и приложни основи на социалната психология. - М.: ВЛАДОС, 1995.

    2. Давидов В.П. Основи на методологията, методологията и технологията на педагогическите изследвания: Научно-методически наръчник. - М.: Академия на ФСБ, 1997.

    Статистика по математика - това е клон на математиката, който изучава приблизителни методи за събиране и анализ на данни въз основа на резултатите от експеримент за идентифициране на съществуващи модели, т.е. намиране на законите на разпределение на случайни променливи и техните числени характеристики.

    В математическата статистика е обичайно да се разграничават две основни области на изследване:

    1. Оценка на параметрите на генералната съвкупност.

    2. Тестване на статистически хипотези (някои априорни предположения).

    Основните понятия на математическата статистика са: обща съвкупност, извадка, теоретична функция на разпределение.

    Общото население е колекция от всички възможни статистически данни при наблюдение на случайна променлива.

    X G \u003d (x 1, x 2, x 3, ..., x N,) \u003d (x i; i \u003d 1, N)

    Наблюдаваната случайна променлива X се нарича характеристика или фактор за вземане на проби. Общата популация е статистически аналог на случайна променлива, нейният обем N обикновено е голям, така че част от данните се избират от нея, наречена извадка или просто извадка.

    X B \u003d (x 1, x 2, x 3, ..., x n,) \u003d (x i; i \u003d 1, n)

    X B Ì X G, n £ N

    Проба е набор от произволно избрани наблюдения (обекти) от общата популация за директно проучване. Броят на обектите в извадката се нарича размер на извадката и се обозначава с n. Обикновено извадката е 5% -10% от общата популация.

    Използването на извадка за конструиране на закономерностите, на които е подчинена наблюдаваната случайна величина, дава възможност да се избегне нейното непрекъснато (масово) наблюдение, което често е ресурсоемък процес, ако не просто невъзможно.

    Например, популация е множество индивиди. Изследването на цяла популация е трудоемко и скъпо, така че данните се събират от извадка от индивиди, които се считат за представители на тази популация, което позволява да се направят изводи за тази популация.

    Пробата обаче задължително трябва да отговаря на условието представителност, т.е. да даде информирана представа за общото население. Как да формираме представителна (представителна) извадка? В идеалния случай човек се стреми да получи произволна (рандомизирана) извадка. За целта се прави списък на всички индивиди от популацията и те се избират на случаен принцип. Но понякога разходите за съставяне на списъка може да са неприемливи и тогава те вземат приемлива проба, например една клиника, болница и изследват всички пациенти в тази клиника с това заболяване.

    Всеки елемент от извадката се нарича вариант. Броят на повторенията на варианти в извадка се нарича честота на поява. Количеството се извиква относителна честота опции, т.е. се намира като съотношение на абсолютната честота на вариантите към целия размер на извадката. Извиква се последователност от варианти, написани във възходящ ред вариационна серия.


    Помислете за три форми на вариационна поредица: класирана, дискретна и интервална.

    Класиран ред е списък на отделни единици от популацията във възходящ ред на изследваната черта.

    Дискретни вариационни серии е таблица, състояща се от графики или редове: специфична стойност на атрибута x i и абсолютната честота n i (или относителна честота ω i) на проявлението на i-тата стойност на атрибута x.

    Пример за вариационна поредица е таблицата

    Напишете разпределението на относителните честоти.

    Решение: Намерете относителните честоти. За целта разделяме честотите на размера на извадката:

    Разпределението на относителните честоти е както следва:

    0,15 0,5 0,35

    Контрол: 0,15 + 0,5 + 0,35 \u003d 1.

    Дискретни серии могат да се показват графично. В правоъгълна декартова координатна система се маркират точки с координати () или (), които са свързани с прави линии. Такава прекъсната линия се нарича многоъгълни честоти.

    Изградете дискретна вариационна поредица (DVR) и нарисувайте многоъгълник за разпределение на 45 кандидати според броя точки, които са получили на приемните изпити:

    39 41 40 42 41 40 42 44 40 43 42 41 43 39 42 41 42 39 41 37 43 41 38 43 42 41 40 41 38 44 40 39 41 40 42 40 41 42 40 43 38 39 41 41 42.

    Решение: За да изградим вариационна серия, подреждаме различните стойности на атрибута x (варианти) във възходящ ред и записваме неговата честота под всяка от тези стойности.

    Нека да изградим многоъгълник от това разпределение:

    Фигура: 13.1. Честотен полигон

    Интервал на вариация използвани за голям брой наблюдения. За да изградите такава серия, трябва да изберете броя на интервалите за характеристиката и да зададете дължината на интервала. При голям брой групи интервалът ще бъде минимален. Броят на групите от вариационната серия може да бъде намерен с помощта на формулата на Стърджс: (k е броят на групите, n е размерът на извадката), а ширината на интервала е

    където е максимумът; - минималната стойност е вариант и се нарича тяхната разлика R диапазон на вариация.

    Проучва се извадка от 100 души от общия брой на всички студенти в медицински университет.

    Решение: Нека изчислим броя на групите :. По този начин, за да се състави интервална серия, е по-добре тази проба да се раздели на 7 или 8 групи. Нарича се съвкупността от групи, на които се разделят резултатите от наблюденията и честотите на получаване на резултатите от наблюденията във всяка група статистическа популация.

    За да визуализирате статистическото разпределение, използвайте хистограма.

    Честотна хистограма е стъпаловидна фигура, състояща се от съседни правоъгълници, изградени върху една права линия, чиито основи са еднакви и равни на ширината на интервала, а височината е равна или на честотата на попадане в интервала, или на относителната честота ω i.

    Наблюденията на броя на частиците, влизащи в брояча на Гайгер в рамките на минута, дадоха следните резултати:

    21 30 39 31 42 34 36 30 28 30 33 24 31 40 31 33 31 27 31 45 31 34 27 30 48 30 28 30 33 46 43 30 33 28 31 27 31 36 51 34 31 36 34 37 28 30 39 31 42 37.

    Постройте от тези данни серия от вариации на интервали с равни интервали (I интервал 20-24; II интервал 24-28 и т.н.) и начертайте хистограма.

    Решение: n \u003d 50

    Хистограмата на това разпределение изглежда така:

    Фигура: 13.2. Хистограма на разпределението

    Опции за работа

    № 13.1. Напрежението в мрежата се измерва на всеки час. В този случай бяха получени следните стойности (B):

    227 219 215 230 232 223 220 222 218 219 222 221 227 226 226 209 211 215 218 220 216 220 220 221 225 224 212 217 219 220.

    Изградете статистическо разпределение и нарисувайте многоъгълник.

    № 13.2. Наблюденията на кръвната захар при 50 души дават следните резултати:

    3.94 3.84 3.86 4.06 3.67 3.97 3.76 3.61 3.96 4.04

    3.82 3.94 3.98 3.57 3.87 4.07 3.99 3.69 3.76 3.71

    3.81 3.71 4.16 3.76 4.00 3.46 4.08 3.88 4.01 3.93

    3.92 3.89 4.02 4.17 3.72 4.09 3.78 4.02 3.73 3.52

    3.91 3.62 4.18 4.26 4.03 4.14 3.72 4.33 3.82 4.03

    Постройте от тези данни серия от вариации на интервали с равни интервали (I - 3.45-3.55; II - 3.55-3.65 и др.) И я изобразете графично, нарисувайте хистограма.

    № 13.3. Постройте полигон на честотите на разпределение на скоростта на утаяване на еритроцитите (ESR) при 100 души.

    Помислете за някои концепции и основни подходи за класификация грешки. Чрез метода на изчисление грешките могат да бъдат разделени на абсолютни и относителни.

    Абсолютна грешка е равна на разликата в средното измерване на количеството хи истинската стойност на това количество:

    В някои случаи, ако е необходимо, се изчисляват грешките при единични определяния:

    Имайте предвид, че измерената стойност при химичен анализ може да бъде както съдържанието на компонент, така и аналитичен сигнал. В зависимост от това дали резултатът от анализа надценява или подценява грешката, грешките могат да бъдат положителени отрицателен.

    Относителна грешка може да се изрази във фракции или проценти и обикновено няма знак:

    или

    Грешките могат да бъдат класифицирани според техния източник. Тъй като има много източници на грешки, тяхната класификация не може да бъде еднозначна.

    Най-често грешките се класифицират според естеството на причините, които ги причиняват. В този случай грешките се разделят на систематичнонебе и непринудено, пропуски (или груби грешки) също се разграничават.

    ДА СЕ систематичен включват грешки, които са причинени от постоянна причина, са постоянни във всички измерения или се променят съгласно постоянен закон, могат да бъдат идентифицирани и отстранени.

    Случайно грешки, причините за които са неизвестни, могат да бъдат оценени чрез методи на математическа статистика.

    Госпожице е грешка, която рязко изкривява резултата от анализа и обикновено е лесно откриваема, обикновено причинена от небрежност или некомпетентност на анализатора. На фиг. 1.1 е схема, обясняваща понятията систематичност и грешки и пропуски. Направо 1 съответства на идеалния случай, когато няма систематични и случайни грешки при всички N определяния. Редове 2 и 3 също са идеализирани примери за химичен анализ. В един случай (ред 2) случайните грешки напълно липсват, но всички ндефинициите имат постоянна отрицателна систематична грешка Δх; в противен случай (ред 3) изобщо няма системна грешка. Реалната ситуация е отразена в линията 4: има както случайни, така и систематични грешки.

    Фигура: 4.2.1 Систематични и случайни грешки в химичния анализ.

    Разделянето на грешките на систематични и случайни е до известна степен произволно.

    Систематичните грешки на една извадка от резултати при разглеждане на по-голям брой данни могат да станат случайни. Например, систематичната грешка, причинена от неправилни показания на уреда, при измерване на аналитичния сигнал на различни уреди в различни лаборатории, става случайна.

    Възпроизводимост характеризира степента на близост помежду си на отделни дефиниции, разсейването на единични резултати спрямо средното (фиг. 1.2).

    Фигура: 4.2..2. Повторяемост и точност на химичния анализ

    В някои случаи заедно с термина "възпроизводимост" използвайте термина "конвергенция".В този случай под конвергенция се разбира разсейване на резултатите от паралелни определяния, а възпроизводимостта е разсейване на резултатите, получени по различни методи, в различни лаборатории, по различно време и т.н.

    Нали е качеството на химичния анализ, отразяващо близостта до нула на системната грешка. Коректността характеризира отклонението на получения резултат от анализа от истинската стойност на измерената стойност (вж. Фиг. 1.2).

    Общо население - хипотетичен набор от всички възможни резултати от -∞ до + ∞;

    Анализът на експериментални данни показва, че се наблюдават големи грешки по-рядкоотколкото малките. Също така се отбелязва, че с увеличаване на броя на наблюденията се срещат едни и същи грешки на различни признаци по равно често. Тези и други свойства на случайни грешки се описват от нормалното разпределение или уравнението на Гаус,което описва плътността на вероятностите
    .

    където х-значение на случайна променлива;

    μ – обща средна стойност (очаквана стойност- постоянен параметър);

    Очаквана стойност- за непрекъсната случайна променлива е границата, към която се стреми средната стойност с неограничено увеличение на пробата. По този начин математическото очакване е средната стойност за цялото население като цяло, понякога се нарича обща средна стойност.

    σ 2 -дисперсия (постоянен параметър) - характеризира разсейването на случайна променлива спрямо нейното математическо очакване;

    σ е стандартното отклонение.

    Дисперсия - характеризира разсейването на случайна променлива спрямо нейното математическо очакване.

    Популация от проби (проба) - реалният брой (n) резултати, които изследователят има, n \u003d 3 ÷ 10.

    Нормален закон за разпределение неприемливо да се справят с малък брой промени в извадката (обикновено 3-10) - дори ако популацията като цяло се разпределя нормално. За малки проби използвайте вместо нормалното разпределение разпределение на ученика (т - разпространение), който свързва трите основни характеристики на пробата -

    Ширината на доверителния интервал;

    Съответната вероятност;

    Размер на пробата.

    Преди да обработвате данни, използвайки методи на математическа статистика, е необходимо да се идентифицирате пропуска (груби грешки) и ги изключете от разглежданите резултати. Един от най-простите е методът за откриване на пропуски с помощта на Q - тест с броя на измерванията n< 10:

    където R = х макс - х мин - обхватът на вариация; х 1 - подозрително видна ценност; x 2 - резултатът от единично определяне, най-близък по стойност до х 1 .

    Получената стойност се сравнява с критичната стойност на Q крит при ниво на доверие P \u003d 0,95. Ако Q\u003e Q крит, валцуваният резултат е пропуск и се отхвърля.

    Основните характеристики на пробата... За вземане на проби от н резултатите се изчисляват средното,:

    и отклонениехарактеризиращ разсейването на резултатите спрямо средната стойност:

    Дисперсията в изрична форма не може да се използва за количествено характеризиране на разсейването на резултатите, тъй като нейното измерение не съвпада с измерението на резултата от анализа. Да се \u200b\u200bхарактеризира използването на разсейването стандартно отклонение,С.

    Тази стойност се нарича още средно-квадратно (или стандартно) отклонение или средно-квадратна грешка на отделен резултат.

    ОТНОСНОотносително стандартно отклонениеили коефициентът на вариация (V) се изчислява от съотношението

    Дисперсията на средната аритметична стойност изчисли:

    и стандартното отклонение на средната стойност

    Трябва да се отбележи, че всички стойности - отклонение, стандартно отклонение и относително стандартно отклонение, както и отклонението на средната аритметична стойност и стандартното отклонение на средната аритметична стойност - характеризират възпроизводимостта на резултатите от химичния анализ.

    Използва се при обработка на малки (n<20) выборок из нормально распределенной генеральной совокупности t – распределение (т.е. распределение нормированной случайной величины) характеризуется соотношением

    къдетот стр , е разпределение на ученика с броя на степени на свобода е= н-1 и ниво на доверие Р \u003d 0,95(или ниво на значимост р \u003d 0,05).

    Стойностите на t - разпределенията са дадени в таблиците, те се изчисляват за пробата в н дава стойността на доверителния интервал на измерената стойност за дадена вероятност за доверие съгласно формулата

    Доверителен интервал характеризира както възпроизводимостта на резултатите от химичния анализ, така и - ако е известна истинската стойност на х - тяхната коректност.

    Пример за изпълнение на тестова работа No2

    Задачата

    Кога ипри анализа на въздуха за съдържание на азот по хроматографски метод бяха получени следните резултати за две серии експерименти:

    Решение:

    Проверете редовете за груби грешки с помощта на Q-теста. Защо да ги поставяте в низходящ ред (от минимум до максимум или обратно):

    Първи епизод:

    77,90<77,92<77,95<77,99<78,05<78,07<78,08<78,10

    Проверяваме екстремните резултати от поредицата (дали съдържат груба грешка).

    Получената стойност се сравнява с табличната стойност (Таблица 2 от допълнението). За n \u003d 8, p \u003d 0,95 Q tab \u003d 0,55.

    Защото Раздел Q\u003e Изчисление Q 1, най-лявата цифра не е "пропуск".

    Проверка на най-дясната цифра

    Q изч

    Числото вдясно също не е грешно.

    Ние имаме резултати от втори редда във възходящ ред:

    78,02<78,08<78,13<78,14<78,16<78,20<78,23<78,26.

    Проверяваме крайните резултати от експериментите - дали са грешни.

    Q (n \u003d 8, p \u003d 0,95) \u003d 0,55. Стойност на таблицата.

    Най-лявата стойност не е грешна.

    Цифрата вдясно (грешна ли е).

    Тези. 0,125<0,55

    Числото вдясно не е „пропуск“.

    Резултатите от експериментите подлагаме на статистическа обработка.

      Изчисляваме среднопретеглената стойност на резултатите:

    - за първия ред резултати.

    - за втория ред резултати.

      Дисперсия спрямо средната стойност:

    - за първия ред.

    - за втория ред.

      Стандартно отклонение:

    - за първия ред.

    - за втория ред.

      Стандартно отклонение на средната аритметична стойност:

    За малки (n<20) выборках из нормально распределенной генеральной совокупности следует использовать t – распределение, т.е. распределение Стьюдента при числе степени свободы f=n-1 и доверительной вероятности p=0,95.

    Използвайки таблиците на t - разпределенията, стойността на доверителния интервал на измерената стойност за дадена вероятност за доверие се определя за извадка от n - резултати. Този интервал може да бъде изчислен:

    ОТ еднаква дисперсияи средни резултатидве проби.

    Сравнението на двете вариации се извършва с F-разпределение (разпределение на Fisher). Ако имаме два примерни набора с дисперсии S 2 1 и S 2 2 и броя на степените на свобода f 1 \u003d n 1 -1 и f 2 \u003d n 2 -1, съответно, изчисляваме стойността на F:

    F \u003d S 2 1 / S 2 2

    освен това числителят винаги съдържа по-голямата от двете сравнени дисперсии на извадката. Резултатът се сравнява със стойността на таблицата. Ако F 0\u003e F крит (при p \u003d 0,95; n 1, n 2), тогава несъответствието между отклоненията е значително и разглежданите набори от проби се различават по възпроизводимост.

    Ако несъответствието между отклоненията е незначително, възможно е да се сравнят средните x 1 и x 2 на двете проби, т.е. установете дали има статистически значима разлика между резултатите от теста. За решаване на проблема се използва t - разпределение. Претеглената средна стойност на двете дисперсии се изчислява предварително:

    И среднопретегленото стандартно отклонение

    и след това - стойността на t:

    Стойност т опит сравни с т крит с броя на степените на свобода f \u003d f 1 + f 2 \u003d (n 1 + n 2 -2) и ниво на доверие на пробата p \u003d 0,95. Ако едновременно т опит > т крит , след това несъответствието между средното и значителна и извадката не принадлежи към същата генерална съвкупност. Ако t exp< t крит, расхождение между средними незначимо, т.е. выборки принадлежат одной и той же генеральной совокупности, и, следовательно, данные обеих серий можно объединить и рассматривать их как одну выборочную совокупность из n 1 +n 2 результатов.

    Контролна задача номер 2

    Анализът на въздуха за съдържанието на компонент X чрез хроматографски метод за две серии дава следните резултати (таблица-1).

    3. Дали резултатите от двете проби и една и съща популация са. Проверете чрез t тест на Student (p \u003d 0,95; n \u003d 8).

    Таблица-4.2.1- Изходни данни за контролна задача No2

    Вариант No.

    Компонент


    Близо