Авиационно инженерство Административно право Административно право Беларус Алгебра Архитектура Безопасност на живота Въведение в професията „психолог” Въведение в икономиката на културата Висша математика Геология Геоморфология Хидрология и хидрометрия Хидросистеми и хидравлични машини Културология Медицина Психология икономика дескриптивна геометрия Основи на икономически т Oria професионална безопасност Пожарна тактика процеси и структури на мисълта, Професионална психология Психология Психология на управлението на съвременната фундаментални и приложни изследвания в апаратура социалната психология социални и философски проблеми Социология Статистика теоретичните основи на компютъра автоматично управление теория на вероятностите транспорт Закон Turoperator Наказателно право Наказателно-процесуалния управление модерна производствена Физика Физични феномени Философски хладилни инсталации и екология Икономика История на икономиката Основи на икономиката Икономика на предприятията Икономическа история Икономическа теория Икономически анализ Развитие на икономиката на ЕС Спешни ситуации ВКонтакте Однокласници Моят свят Facebook LiveJournal Instagram

Корелационни показатели за стесняване на модела за многофакторна корелационна регресия




Близостта на връзката между изследваните параметри при множествена корелация се определя на базата на различни коефициенти. За да може регресионното уравнение адекватно да отразява (приблизително) реални симулирани социално-икономически процеси или явления, трябва да бъдат изпълнени условията и изискванията на многократния корелационен и регресионен анализ.

Корелационно - регресионен анализ : аналитичен израз на уравнението (праволинейна, криволинейна) регресия за многофакторен корелационно-регресионен модел. Определяне на параметрите и тяхната интерпретация.

Близостта на връзката между тях се измерва чрез съотношението на факторното отклонение към общата вариация на произтичащия атрибут, наречен индекс на определяне. Индексът на определяне характеризира пропорцията на вариацията на произтичащата характеристика под влиянието на факторния признак в общата променливост на получената характеристика. Ако има връзка между признаците, тогава, когато тя се увеличава, т.е. увеличавайки близостта на връзката между продуктивните и факторните признаци, индексът на определяне се увеличава и намалява, тъй като намалява. Така индексът на определяне характеризира близостта на връзката, близостта на корелацията към функционалната.

Квадратният корен на индекса за определяне е индекс на корелация или теоретично съотношение на корелация . Корелационният индекс, или теоретичното съотношение на корелация, характеризира близостта на връзката с всяка форма на зависимост. Остатъчна дисперсия Необходимо е да се избере най-добрата функция, която най-много изравнява (приближава) емпиричната регресия. Апроксимиращата функция се избира според минималната остатъчна дисперсия s 2 OST = S (y t - ) 2 / n или ,

Специален случай на корелационния индекс е коефициентът на линейна корелация r , който се използва за оценка на близостта на връзката с линейна зависимост. Коефициентът на корелация приема стойности от -1 до +1, което показва не само близостта, но и посоката на връзката. Знакът "+" показва пряка връзка между ефективните и факторните знаци, знакът "-" показва обратна връзка между тях. Ако r = 0, тогава няма връзка между знаците. Колкото по-близко е r до едно, толкова по-близо е връзката между разглежданите характеристики.

В линейната форма на комуникация, параметърът на уравнението на права линия е регресионният коефициент a 1 и коефициентът на корелация r са взаимно свързани както следва:

и 1 = rs y / s x . В случай на права линия, линейният корелационен коефициент е идентичен с корелационния индекс, те са числено равни: ,

Линейният коефициент на корелация r се използва за оценка на близостта на връзката с линейна зависимост: уравнението на права линия = a 0 + a 1 x


border=0


За опростяване на изчисленията на коефициента на линейна корелация използвайте трансформираната формула: ,

Естеството на връзката се определя от стойността на коефициента на корелация :

R стойност на коефициента на корелация комуникационен характер
r = 0 до 0.3 практически отсъства
0 <r <1 0,3 - 0.5 + права беден
-1 <r <0 0,5 - 0.7 - обратно умерен
r = 1 0.7 - 1.0 1 - функционален силен

Значението на коефициента на линейна корелация се определя от t - критерия на Студент. Определя се от изчислената стойност на t calc , която се сравнява с табличната стойност на t crit . Коефициентът на линейна корелация се счита за значителен, ако съотношението: t calc > t crit .

с п с n <50.

t крит се определя от таблицата "Стойността на t - критерия на ученика на ниво значимост." 0.10, 0.05, 0.01 и степени на свобода ,

Задачата на многофакторния корелационно-регресионен анализ е, първо, да се проучат редица фактори, влияещи върху изследвания индикатор и избора на най-значимите; второ, при определяне на степента на влияние на всеки фактор върху произтичащия атрибут чрез изграждане на модел - уравнението за множествена регресия, което ви позволява да определите в коя посока и с каква стойност ще се промени ефективният индикатор, когато всеки фактор, който влиза в модела, се променя; трето, в количествената оценка на близостта на връзката между ефективния знак и факторния.

Математически, проблемът е да се намери аналитичното изразяване на функцията = f (x 1 , x 2 , x 3 , ..., x n ), най-добре отразяващо връзката на факторните знаци с получения резултат. Резултатите от теоретичния анализ и възможността за тяхното приложение в практиката зависят от правилния избор на регресионната функция, поради което формата на връзката трябва най-добре да съответства на действително съществуващите връзки между резултантните и факторните характеристики. Трудността при избора на функция е, че ефективната характеристика с различни фактори може да бъде в различни форми на връзка - права и криволинейна. Емпиричното обосноваване на типа функция, използвайки графиките на двойките, е практически неподходящо за множествена корелация и регресия.



Изборът на формата на уравнението за множествена регресия се основава на теоретичен анализ на изследваното явление. Ако анализът на взаимовръзките между ефективните и факторните знаци не позволява да се спрем на някаква форма на връзка, тогава различните функции се сортират и се избира оптималното, за да се изравни от гледна точка на близостта на емпиричните стойности на ефективната характеристика, но това включва значителна трудоемкост при изчисляване на параметрите на различни уравнения. Ако има специален софтуер, който прилага алгоритъм за повторение на различни PCR уравнения, се получават няколко модела, най-добрият се избира чрез статистическа проверка на параметрите на уравнението въз основа на t-критерия на Student и F-критерия на Fisher .

Изборът на формата на уравнението на множествената регресия се извършва на практика

въз основа на използването на пет типа модели :

линеен a 0 + a 1 x 1 + a 2 x 2 + ... + a n x n ;

на захранване ;

показателен ;

параболичен

хиперболичен

Най- често се спират на линейни модели. Това се обяснява с факта, че, първо, лесно се интерпретират параметрите на линейните уравнения, самите модели са прости и удобни за икономически анализ, и второ, при желание всяка функция може да бъде сведена до линейна форма чрез логаритмиране или промяна на променливи.

В уравнението на линейната регресия в линейна форма параметрите а 1 , а 2 , а 3 , ..., аn - коефициентите на регресия показват степента на влияние на релевантните фактори върху получения резултат, когато други фактори са фиксирани на средното ниво, т.е. колко y ще се промени с увеличаване на съответния коефициент с 1 пункт от неговата единица за промяна; параметър a 0 е свободен член, няма икономически смисъл.

Параметрите на уравнението за множествена регресия , както и двойката, се изчисляват по метода на най-малките квадрати, базиран на решението на системата от нормални уравнения. Тъй като коефициентите на регресия са несравними помежду си (факторите имат различни единици за измерване), не е възможно да се сравни силата на влиянието на всеки от факторите, включени в модела, върху получения показател въз основа на коефициентите на регресия. За да се оцени относителната сила на влиянието на факторите, се изчисляват коефициентите на частична еластичност и b-коефициентите.

Личният коефициент на еластичност показва колко процента средно ефективният показател ще се промени, когато факторът се промени с 1% и фиксираната позиция на други фактори и се изчисляват отделно за всеки фактор:

където a i е коефициентът на регресия за i-тия фактор; - средната стойност на i-тия фактор; - средната стойност на ефективния показател.

B-коефициентът показва коя част от стандартното отклонение променя произтичащия атрибут, когато съответният фактор се променя със стойността на стандартното му отклонение. , където s xi , s y - стандартните отклонения на i-тия фактор и произтичащата характеристика.

Поради факта, че икономическите явления са изложени на множество и сложни причини, съществените, систематично действащи фактори трябва да бъдат включени в уравнението за множествена регресия, когато се елиминира влиянието на други фактори. Най-важните фактори се избират въз основа на анализ на близостта и съществеността на връзката между факторите и ефективния показател. В този случай условието за включване на фактори в модела е липсата на много тясна връзка между тях, която е близка до функционалната. Наличието на много близка линейна връзка между два фактора (коефициентът на линейна корелация r надвишава абсолютната стойност от 0,85) се нарича колинеарност , а между няколко фактора - мултиколинеарност .

Причините за мултиколинеарността между признаците са, на първо място, че анализираните знаци характеризират един и същ аспект на явление или процес (например, уставният капитал и броят на служителите характеризират размера на предприятието) и не е препоръчително да се включват в модела едновременно; второ, факторните знаци са съставните елементи на всеки от тях, дублират се взаимно или тяхната обща стойност дава постоянна стойност (например, енергоснабдяването и съотношението капитал-труд, делът на заетите и собствените средства). Ако в модела са включени многоколинеарни фактори, тогава регресионното уравнение ще отразява неадекватно реалните икономически отношения, параметрите на модела ще бъдат изкривени (надценени), смисълът ще бъде променен и икономическата интерпретация на регресионните и корелационните коефициенти ще бъде трудна.

Следователно, при изграждането на модел, един от колинеарните фактори се изключва въз основа на качествен и логически анализ, или началните факторни знаци се трансформират в нови, разширени. Качеството и адекватността на модела към реално социално-икономическо явление и процес се определя от оптималността на броя на факторите: колкото повече фактори са включени, толкова по-добре моделът описва явлението и процеса, но този модел е труден за изпълнение; при малък брой фактори моделът не е достатъчно адекватен.

Проблемът за избор на факторни знаци и намаляване на измерението на модела на множествената корелация се решава на базата на евристични и многоизмерни методи за анализ. Евристичните методи за анализ включват метода на експертните оценки, базиран на интуитивно-логически предпоставки и съществен и качествен анализ на непараметричните показатели за степента на комуникативност: коефициенти на ранг корелация, конкордантност. Най-често използваният метод е поетапна регресия , състояща се в последователното включване на факторите в модела и оценката на тяхната значимост.

При въвеждане на коефициент се определя каква сума от квадратите на остатъците намалява и стойността на множествения коефициент на корелация R се увеличава.Ако факторът xk е включен в модела, стойността на R се увеличава и коефициентът на регресия ак не се променя или променя леко, тогава този фактор е значителен и неговото включване в модела е необходимо.

· Общият обем на изследваните показатели трябва да бъде хомогенен според условията за формиране на ефективни и факторни знаци (отделните наблюдения трябва да бъдат изключени от съвкупността);

· Полученият атрибут трябва да се подчинява на нормалния закон за разпределение, факторният трябва да е близо до нормалното разпределение. Ако обемът на агрегата е достатъчно голям (n> 50), тогава нормалността на разпределението може да бъде потвърдена въз основа на изчисленията и анализа на Пиърсън, Ястремски, Колмогоров, Боярски и други критерии;

· Симулираното явление или процес се описва количествено (параметрите трябва да имат числено изражение) чрез едно или няколко уравнения на причинно-следствените връзки. Препоръчително е да се опишат причинно-следствените връзки чрез линейни или близки до линейни зависимости;

· Съгласуваност на териториалната и времева структура на изследваната популация, липсата на количествени ограничения върху параметрите на модела;

· Достатъчност на населението: броят им трябва да бъде няколко пъти по-голям от броя на факторите, включени в модела. Всеки фактор трябва да има поне 5-6 наблюдения, т.е. броят на факторните признаци трябва да бъде 5–6 пъти по-малък от обема на изследваната популация.

Основните етапи на корелационния и регресионен анализ са:

· Предварителен теоретичен анализ на същността на явлението, който позволява да се установят причинно-следствените връзки между признаците, да се изберат най-важните фактори, да се вземе решение за измерване на ефективни и факторни признаци;

· Изготвяне на първоначална информация , включително въпроси за адекватността на наблюдаваните единици, хомогенността на набора от изследвани характеристики и близостта на тяхното разпределение към нормалното;

· Избор на формата на връзката между характеристиката на изпълнението и факторите, базирани на изброяването на няколко аналитични функции;

· Проучване на близостта на връзката между показателя за изпълнение и факторите, както и между факторите, основани на конструирането на матрица на двойни линейни коефициенти на корелация и скрининг на мултиколинеарни фактори;

· Избор на значими (значими) фактори, включени в мултифакторния модел - уравнение за множествена регресия, основано на съответните статистически методи;

· Изчисляване на параметрите на уравнението за множествена регресия и оценка на значимостта на избраните фактори, корелационни и регресионни коефициенти при използване на критериите - Student и F- Fisher ;

· Анализ на резултатите.

Взаимоотношенията между признаците се анализират, като правило, въз основа на извадкови наблюдения, следователно, за да се провери дали получените зависимости са редовни, а не случайни, се оценява значимостта (съществеността) на корелационните и регресионните показатели.

Корелационно - регресионен анализ се използва за оценка на показателите за бизнес плана и регулаторните нива на икономическите показатели, отразяващи ефективността на използване на производствените ресурси, идентифициране на съществуващите производствени резерви, провеждане на сравнителен анализ, оценка на потенциалните възможности на предприятията, краткосрочно прогнозиране на развитието на производството.

Уравнението за множествена регресия ви позволява да намерите теоретичната, възможна стойност на ефективния индикатор за определени стойности на факторните знаци.

Параметрите на уравнението за множествена регресия се изчисляват по метода на най-малките квадрати, базиран на решаване на система от нормални уравнения. За уравнение на линейна регресия с п фактори, системата се изгражда от (n + 1) нормални уравнения:

a 0 n + a 1 Sx 1 + a 2 Sx 2 + ... + a n Sx n = Sy,

a 0 Sx 1 + a 1 Sx 2 1 + a 2 Sx 1 x 2 + ... + a n Sx 1 x n = Syx 1 ,

:

a 0 Sx n + a 1 Sx 1 x n + a 2 Sx 2 x n + ... + a n Sx 2 n = Syx n .

Близостта на връзката между изследваните параметри при множествена корелация се определя на базата на различни коефициенти.

Коефициентите на двойна корелация r измерват близостта на линейната зависимост между факторите и между получената марка и всеки от разглежданите фактори, без да се взема предвид тяхното взаимодействие с други фактори.

Коефициентите на частична корелация характеризират степента на влияние на факторите върху резултата, при условие че другите фактори са фиксирани на постоянно ниво. В зависимост от броя на факторите, чието влияние е изключено, коефициентите на частична корелация могат да бъдат от първи ред (ако е изключено влиянието на един фактор), на втория ред (ако са изключени два фактора) и т.н.

Коефициентът на частична корелация от първи ред между y и x 1 с изключение на влиянието на x 2 в двуфакторния модел се изчислява по формулата: ,

където r yx 1 , r yx 2 , r x1x2 - двойки коефициенти на корелация между съответните характеристики.

Коефициентът на кумулативна множествена корелация, R, оценява близостта на връзката между получения резултат и всички фактори. Това е основният показател за линейна множествена корелация. За модел с два фактора, коефициентът на кумулативната многократна корелация се изчислява по формулата:

, Кумулативният коефициент на корелация R варира от 0 до 1. Колкото по-малки са емпиричните стойности на произтичащата характеристика, така и корелационната връзка между изследваните параметри и кумулативния коефициент на множествена корелация към единица.

Кумулативният коефициент на множественото определяне , равен на R 2 , показва колко от вариацията на произтичащия признак се дължи на влиянието на факторите, включени в модела.

Индексът на кумулативната множествена корелация характеризира близостта на връзката между получената характеристика и всички фактори с криволинейна връзка:

= където - дисперсията на получената характеристика под влияние на факторите, включени в модела; - остатъчна дисперсия на произтичащия признак, причинена от влиянието на факторите, които не са взети под внимание от модела. В линейната форма на комуникация, кумулативният коефициент и индексът на множествена корелация са еднакви.

Значението на коефициента на множествена корелация R се определя от критерия F-Fisher. Определя се от изчислената стойност на F calc , която се сравнява с табличната стойност на F crit . Коефициентът на множествена корелация се счита за значителен, при условие че е налице връзка: F calc > F crit .

или ,

n е броят на наблюденията, m е броят на параметрите на уравнението.

F крит выбирается по таблице «Значение при заданном F – критерию Фишера при уровне значимости », и ,

Оценка существенности включения фактора в модель осуществляется по частному F – критерию Фишера. Фактор считается значимым при соблюдении соотношения: F расч > F крит .

Д л я фактора х 1 : ;

Для фактора х 2 : ,





; Дата на добавяне: 2014-01-25 ; просмотров: 38446 ; Публикуваните материали нарушават ли авторските права? | | Защита на личните данни | РАБОТА НА ПОРЪЧКА


Не намерихте това, което търсите? Използвайте търсенето:

Най-добри думи: Научете се да учите, а не да учите! 9197 - | 7047 - или прочетете всички ...

Вижте също:

  1. A. Макроэкономические модели, их виды и показатели
  2. I. Абсолютни показатели за финансова устойчивост на предприятието
  3. I. Медицинска демография. Медицински и демографски показатели за общественото здраве
  4. II Статистические показатели доходов и расходов населения
  5. II. Коефициенти на регулиране - показатели на капиталовата структура (коефициенти на финансова стабилност)
  6. II. Модели за социално осигуряване
  7. II. Относителни показатели за финансова стабилност
  8. II. Показатели тренированности при стандартных нагрузках
  9. II. НАЧИН НА РАЗВИТИЕ НА КАПИТАЛИЗМА 2 страница. Голяма острота в годините 1819-1820. стигна до конфликт за робството. Тя възникна във връзка с петицията на територията на Мисури за Конгреса за предоставяне на правата му
  10. II. Ролята на държавата е различна поради спецификата на методите и методите на правното регулиране.
  11. II. Финансови модели
  12. III. Определяне на степента на опасност от инфекциозни заболявания при извънредни ситуации и техните най-значими показатели


border=0
2019 @ edubook.site

Генериране на страницата над: 0.008 сек.