Нога, Ори және Гили үшін — ДК
Шу (ауытқу)
Daniel Kahneman, Olivier Sibony, Cass R. Sunstein
Жазылымсыз режим: 20-беттен кейін жазылым беті ашылады, әрі қарай әр 10 бет сайын (ең көбі 5 рет).
Фантин және Лелия үшін — ОС
Саманта үшін — КРС

КІРІСПЕ
Қателіктің екі түрі
Төрт дос командасының ату тиріне барғанын елестетіп көріңізші. Әр командада бес адамнан бар; олар бір мылтықты кезекпен қолданады және әрқайсысы бір рет оқ атады. 1-суретте олардың нәтижелері көрсетілген.
Мінсіз әлемде әрбір оқ нысананың дәл ортасына (ондыққа) тиюі керек еді.

1-СУРЕТ: Төрт команда
А командасының жағдайы осыған өте жақын. Команданың атқан оқтары нысана ортасына тығыз топтасқан, бұл мінсіз үлгіге жақын.
Біз В командасын бейімді (бейімділік немесе bias — нәтижелердің нысанадан бір бағытқа қарай жүйелі түрде ауытқуы) деп атаймыз, өйткені олардың оқтары нысанадан жүйелі түрде ауытқып тұр. Суретте көрсетілгендей, бұл ауытқудың тұрақтылығы алдын ала болжам жасауға мүмкіндік береді. Егер осы команда мүшелерінің бірі тағы бір рет оқ ататын болса, біз оның алдыңғы бес оқ тиген аймаққа түсетініне бәс тігер едік. Бейімділіктің тұрақтылығы оған себептік түсіндірме іздеуге итермелейді: мүмкін, команда мылтығының көздеуіші қисайған болар.
Біз С командасын шулы (шу немесе noise — шешімдердің немесе нәтижелердің кездейсоқ, болжап болмайтын шашыраңқылығы) деп атаймыз, өйткені олардың оқтары жан-жаққа шашырап кеткен. Мұнда айқын бейімділік байқалмайды, себебі оқтардың тиген жерлері шамамен нысананың ортасына бағытталған. Егер осы команда мүшелерінің бірі тағы бір оқ атса, оның қайда тиетіні туралы ештеңе айта алмаймыз. Сонымен қатар, С командасының нәтижелерін түсіндіретін ешқандай қызықты болжам ойға келмейді. Біз тек олардың нашар мерген екенін білеміз. Олардың неге соншалықты «шулы» екенін білмейміз.
D командасы әрі бейімді, әрі шулы. В командасы сияқты, олардың оқтары нысанадан жүйелі түрде ауытқыған; С командасы сияқты, оқтары жан-жаққа шашырап кеткен.
Бірақ бұл кітап нысана көздеу туралы емес. Біздің тақырыбымыз — адам қателігі. Бейімділік пен шу — жүйелі ауытқу мен кездейсоқ шашыраңқылық — қателіктің әртүрлі құрамдас бөліктері. Нысаналар осы айырмашылықты айқын көрсетеді.
Ату алаңы — адамның пайымдауында, әсіресе адамдардың ұйымдар атынан қабылдайтын әртүрлі шешімдерінде не дұрыс болмауы мүмкін екендігінің метафорасы. Мұндай жағдайларда біз 1-суретте көрсетілген қателіктің екі түрін де кездестіреміз. Кейбір пайымдаулар бейімді келеді; олар нысанадан жүйелі түрде ауытқиды. Басқа пайымдаулар шулы болады, яғни бірдей шешімге келуі тиіс адамдар нысананың әр тұсынан шығады. Өкінішке орай, көптеген ұйымдар бейімділіктен де, шудан да зардап шегеді.
2-сурет бейімділік пен шудың арасындағы маңызды айырмашылықты көрсетеді. Онда егер сізге нысананың тек артқы жағы ғана көрсетілсе, яғни олардың қай нүктені көздегені белгісіз болса, ату алаңында не көретініңіз бейнеленген.
Нысананың артқы жағынан қарап, А немесе В командасының қайсысы ортаға жақынырақ екенін айта алмайсыз. Бірақ С және D командаларының шулы екенін, ал А және В командаларының олай емес екенін бір қарағаннан-ақ түсінуге болады. Шынында да, сіз шашыраңқылық туралы 1-суреттегідей ақпаратқа иесіз. Шудың жалпы қасиеті — нысана немесе бейімділік туралы ештеңе білмесеңіз де, оны тануға және өлшеуге болады.

2-СУРЕТ: Нысананың артқы жағына қарау
Шудың бұл жалпы қасиеті біздің осы кітаптағы мақсатымыз үшін өте маңызды, өйткені біздің көптеген қорытындыларымыз дұрыс жауабы белгісіз немесе тіпті білу мүмкін емес пайымдауларға негізделген.
Дәрігерлер бір науқасқа әртүрлі диагноз қойғанда, науқастың нақты немен ауыратынын білмей-ақ, олардың арасындағы келіспеушілікті зерттей аламыз. Кино саласының басшылары фильмнің нарықтағы сұранысын бағалағанда, фильмнің қанша табыс тапқанын немесе тіпті оның түсірілген-түсірілмегенін білмей-ақ, олардың жауаптарындағы құбылмалылықты зерттей аламыз. Бір жағдайға қатысты пайымдаулардың қаншалықты алшақ екенін өлшеу үшін кімнің дұрыс екенін білудің қажеті жоқ. Шуды өлшеу үшін нысананың артқы жағына қарау жеткілікті.
Пайымдаудағы қателікті түсіну үшін біз бейімділікті де, шуды де түсінуіміз керек. Кейде, көріп отырғанымыздай, шу ең маңызды мәселе болып табылады. Бірақ адам қателігі туралы қоғамдық талқылауларда және бүкіл әлемдегі ұйымдарда шу сирек ескеріледі. Бейімділік — басты кейіпкер. Шу — сахна сыртындағы елеусіз қатысушы ғана. Бейімділік тақырыбы мыңдаған ғылыми мақалалар мен ондаған танымал кітаптарда талқыланған, бірақ олардың кейбірінде ғана шу мәселесі айтылады. Бұл кітап — сол тепе-теңдікті қалпына келтіруге бағытталған біздің әрекетіміз.
Нақты өмірдегі шешімдерде шудың мөлшері жиі өте жоғары болады. Дәлдік маңызды болып табылатын жағдайлардағы шудың алаңдатарлық деңгейіне бірнеше мысал:
Медицина шулы. Бір науқасты қараған әртүрлі дәрігерлер науқаста тері қатерлі ісігі, сүт безі қатерлі ісігі, жүрек ауруы, туберкулез, пневмония, депрессия және басқа да көптеген аурулардың бар-жоғы туралы әртүрлі шешім қабылдайды. Шу деңгейі әсіресе субъективті пайымдау маңызды болып табылатын психиатрияда өте жоғары. Дегенмен, рентген суреттерін оқу сияқты шу күтілмейтін салаларда да айтарлықтай алшақтықтар кездеседі. Балаға қамқоршылық жасау туралы шешімдер шулы. Балаларды қорғау агенттіктерінің мамандары балалардың зорлық-зомбылық қаупіне ұшырағанын және оларды асырап алушы отбасыларға беру қажеттігін бағалауы тиіс. Жүйе шулы, өйткені кейбір мамандар баланы асырап алушы отбасына жіберуге басқаларға қарағанда әлдеқайда бейім. Жылдар өткен соң, осындай қатал мамандардың шешімімен асырап алушы отбасыларға жіберілген «сәтсіз» балалардың өмірінде жағымсыз салдарлар көбірек байқалады: қылмыс деңгейінің жоғарылауы, жасөспірімдер арасындағы босанудың көбеюі және табыстың төмендегі. Болжамдар шулы. Кәсіби болжамшылар жаңа өнімнің ықтимал сатылымы, жұмыссыздық деңгейінің өсуі, қиындыққа тап болған компаниялардың банкроттық ықтималдығы және басқа да көптеген мәселелер бойынша бір-біріне мүлдем ұқсамайтын болжамдар жасайды. Олар тек бір-бірімен ғана емес, өз-өздерімен де келіспейді. Мысалы, бір бағдарламалық жасақтаманы әзірлеушілерден бір тапсырманы орындау уақытын екі бөлек күнде сұрағанда, олардың жоспарлаған сағаттары орта есеппен 71%-ға ерекшеленген. Баспана беру туралы шешімдер шулы. Баспана іздеушінің Америка Құрама Штаттарына қабылдануы лотерея сияқты нәрсеге байланысты. Әртүрлі судьяларға кездейсоқ бөлінген істерді зерттеу барысында бір судья өтініш берушілердің 5%-ын қабылдаса, екіншісі 88%-ын қабылдағаны анықталды. Зерттеудің тақырыбы бәрін айтып тұр: «Босқындар рулеткасы». (Біз рулетканы әлі көп көретін боламыз.) Персонал бойынша шешімдер шулы. Жұмысқа үміткерлерден сұхбат алатын мамандар бір адамға қатысты мүлдем әртүрлі баға береді. Бір қызметкердің жұмыс нәтижелерін бағалау да қатты құбылып тұрады және бұл баға жұмыс сапасына емес, бағалаушы адамның тұлғасына көбірек байланысты болады. Кепілдік туралы шешімдер шулы. Айыпталушының кепілмен босатылуы немесе сотқа дейін түрмеге жіберілуі істі қараған судьяның кім екеніне байланысты болады. Кейбір судьялар басқаларға қарағанда әлдеқайда жұмсақ. Сондай-ақ, судьялар қай айыпталушының қашып кету немесе қайта қылмыс жасау қаупі жоғары екенін бағалауда бір-бірінен айтарлықтай ерекшеленеді. Криминалистика шулы. Біз саусақ іздерін сәйкестендіру қатесіз деп ойлауға дағдыланғанбыз. Бірақ криминалистер қылмыс болған жерден табылған іздің күдіктінің ізіне сәйкес келетін-келмейтінін шешуде кейде әртүрлі пікірде болады. Тек сарапшылардың пікірі ғана емес, тіпті бір сарапшының өзі бір ізді әртүрлі уақытта көргенде әртүрлі шешім қабылдауы мүмкін. Мұндай құбылмалылық басқа криминалистикалық пәндерде, тіпті ДНҚ талдауында да құжатталған. Патент беру туралы шешімдер шулы. Патенттік өтінімдер бойынша ірі зерттеудің авторлары шудың рөлін атап өтеді: «Патенттік ведомствоның патентті беруі немесе бас тартуы өтінімнің қай сарапшыға түскеніне айтарлықтай байланысты». Бұл құбылмалылық әділеттілік тұрғысынан алғанда өте алаңдатарлық жағдай.
Осы шулы жағдайлардың барлығы үлкен мұзтаудың көрініп тұрған бөлігі ғана. Адам пайымдауына қай жерде қарасаңыз да, шуды кездестіруіңіз әбден мүмкін. Пайымдауларымыздың сапасын арттыру үшін бізге бейімділікпен қатар шуды да жеңу керек.
Бұл кітап алты бөлімнен тұрады. 1-бөлімде біз шу мен бейімділік арасындағы айырмашылықты зерттейміз және мемлекеттік, сондай-ақ жеке ұйымдардың да кейде таңқаларлық деңгейде шулы болатынын көрсетеміз. Мәселені түсіну үшін біз екі саладағы пайымдаулардан бастаймыз. Біріншісі — қылмыстық жаза кесу (мемлекеттік сектор). Екіншісі — сақтандыру (жеке сектор). Бір қарағанда, бұл екі сала мүлдем басқаша көрінуі мүмкін. Бірақ шуға қатысты олардың ортақ тұстары көп. Осыны дәлелдеу үшін біз шу аудиті (noise audit — ұйым ішіндегі мамандардың бірдей жағдайды қалай әртүрлі бағалайтынын өлшеуге арналған тексеріс) идеясын енгіземіз.
2-бөлімде біз адам пайымдауының табиғатын зерттеп, дәлдік пен қателікті қалай өлшеуге болатынын қарастырамыз. Пайымдаулар бейімділікке де, шуға да бейім. Біз қателіктің осы екі түрінің рөлдері арасындағы таңқаларлық теңдікті сипаттаймыз. Жағдайлық шу (occasion noise — бір адамның немесе топтың бір жағдайға қатысты әртүрлі уақытта әртүрлі шешім қабылдауы) — бұл бір істі бір адамның немесе топтың әртүрлі жағдайларда әртүрлі бағалауындағы құбылмалылық. Топтық талқылау кезінде, кім бірінші сөйлегені сияқты маңызды емес болып көрінетін факторлардың әсерінен жағдайлық шудың таңқаларлық мөлшері пайда болады.
3-бөлім кеңінен зерттелген пайымдаудың бір түріне — болжамдық пайымдауға тереңірек үңіледі. Біз болжам жасау кезінде ережелердің, формулалардың және алгоритмдердің адамдардан басты артықшылығын қарастырамыз: жалпыға ортақ сенімге қайшы, бұл ережелердің ерекше терең түсінігінде емес, олардың «шусыздығында». Біз болжамдық пайымдау сапасының соңғы шегін — болашақты объективті білмеуді — және оның болжам сапасын шектеу үшін шумен қалай «тіл табысатынын» талқылаймыз. Соңында, біз сіздің осы уақытқа дейін өзіңізге қойған сұрағыңызға жауап береміз: егер шу барлық жерде болса, неге сіз оны бұрын байқамағансыз?
4-бөлім адам психологиясына арналады. Біз шудың негізгі себептерін түсіндіреміз. Оларға тұлғалық және когнитивтік стильді қоса алғанда, әртүрлі факторлардан туындайтын тұлғааралық айырмашылықтар; әртүрлі жағдайларды бағалаудағы өзіндік ерекшеліктер; және адамдардың бірдей шкалаларды әртүрлі қолдануы жатады. Біз неліктен адамдардың шуға мән бермейтінін және олардың өздері болжай алмаған оқиғалар мен пайымдауларға жиі таңғалмайтынын зерттейміз.
5-бөлімде пайымдауларыңызды қалай жақсартуға және қателіктердің алдын алуға болатындығы туралы практикалық сұрақтар қарастырылады. (Шуды азайтудың практикалық қолданылуына қызығушылық танытатын оқырмандар 3 және 4-бөлімдерді өткізіп жіберіп, бірден осы бөлімге көше алады. ) Біз медицинада, бизнесте, білім беруде, үкіметте және басқа да салаларда шумен күресу әрекеттерін зерттейміз. Біз шешім гигиенасы (decision hygiene — шешім қабылдау процесіндегі қателіктерді алдын ала тазарту әдістері) деп аталатын шуды азайтудың бірнеше әдісін ұсынамыз. Біз шу көп құжатталған және адамдар оны азайтуға күш салған бес саланы қарастырамыз. Бұған сенімсіз медициналық диагноздар, жұмыс тиімділігін бағалау, криминалистика, жұмысқа қабылдау туралы шешімдер және жалпы болжам жасау жатады. Соңында біз жанама бағалау хаттамасы (mediating assessments protocol — шешім сапасын арттыруға арналған құрылымдық әдіс) деп аталатын жүйені ұсынамыз:
Жанама бағалау хаттамасы — бұл шешім гигиенасының бірнеше негізгі тәжірибелерін қамтитын және шуы аз әрі сенімдірек пайымдаулар жасауға бағытталған нұсқаларды бағалаудың жалпы мақсаттағы тәсілі.
Шудың оңтайлы деңгейі қандай? 6-бөлім осы сұраққа арналған. Мүмкін, бұл интуицияға қайшы келер, бірақ дұрыс деңгей нөл емес. Кейбір салаларда шуды жою мүмкін емес. Басқа салаларда бұл тым қымбатқа түседі. Тағы бір салаларда шуды азайту әрекеттері басқа маңызды құндылықтарға нұқсан келтіруі мүмкін. Мысалы, шуды жоюға бағытталған күш-жігер адамдардың рухын түсіріп, олардың өздерін машинаның бір тетігі сияқты сезінуіне әкелуі мүмкін. Алгоритмдер шешімнің бір бөлігі болғанда, оларға қатысты түрлі қарсылықтар туындайды; біз мұнда солардың кейбірін қарастырамыз. Соған қарамастан, қазіргі шу деңгейі қабылданбайды. Біз жеке және мемлекеттік ұйымдарды шу аудитін жүргізуге және шуды азайтуға барынша күш салуға шақырамыз. Егер олар осылай істейтін болса, ұйымдар кең етек алған әділетсіздікті азайтып, көптеген салалардағы шығындарды қысқарта алар еді.
Осы мақсатты ескере отырып, біз әр тарауды дәйексөз түріндегі бірнеше қысқа тұжырымдармен аяқтаймыз. Сіз бұл мәлімдемелерді сол күйінде қолдана аласыз немесе оларды денсаулық, қауіпсіздік, білім, ақша, жұмыс, ойын-сауық немесе басқа да маңызды мәселелерге бейімдей аласыз. Шу мәселесін түсіну және оны шешуге тырысу — бұл жалғасып жатқан жұмыс және ұжымдық іс. Бәріміздің де осы жұмысқа үлес қосуға мүмкіндігіміз бар. Бұл кітап біздің осы мүмкіндіктерді пайдалана алуымызға деген үмітпен жазылды.
І БӨЛІМ
Шуды іздеу
Бірдей қылмыс жасаған ұқсас адамдардың мүлдем әртүрлі жаза алуы — мысалы, біреуіне бес жыл түрме, ал екіншісіне шартты жаза берілуі — қабылданбайтын жағдай. Дегенмен, көптеген жерлерде дәл осындай жағдай орын алады. Әрине, қылмыстық сот төрелігі жүйесі де бейімділікке толы. Бірақ 1-тараудағы біздің назарымыз шуға және атақты судьяның бұған назар аударып, мұны масқара деп тауып, әлемді белгілі бір мағынада өзгерткен (бірақ жеткілікті емес) жорығына аударылады. Біздің әңгімеміз Америка Құрама Штаттары туралы, бірақ біз басқа да көптеген елдерде ұқсас оқиғалардың орын алатынына сенімдіміз. Ол елдердің кейбірінде шу мәселесі Америка Құрама Штаттарына қарағанда нашар болуы мүмкін. Біз шудың үлкен әділетсіздікке әкелуі мүмкін екенін көрсету үшін жаза кесу мысалын қолданамыз.
Қылмыстық жаза кесудің драмасы өте жоғары, бірақ бізді жеке сектор да алаңдатады, мұнда да ставкалар жоғары болуы мүмкін. Мұны көрсету үшін 2-тарауда ірі сақтандыру компаниясына тоқталамыз. Онда андеррайтерлер (сақтандыру тәуекелін бағалаушылар) әлеуетті клиенттер үшін сақтандыру сыйлықақыларын белгілейді, ал шығындарды реттеушілер талаптардың құнын бағалауы керек. Сіз бұл тапсырмалар қарапайым және механикалық, ал әртүрлі мамандар шамамен бірдей соманы шығарады деп ойлауыңыз мүмкін. Біз бұл болжамды тексеру үшін мұқият әзірленген эксперимент — шу аудитін — жүргіздік. Нәтижелер бізді таңғалдырды, бірақ ең бастысы, олар компания басшылығын есеңгіретіп тастады. Біз білгеніміздей, шудың үлкен көлемі компанияға орасан зор шығын әкелуде. Біз бұл мысалды шудың үлкен экономикалық шығындарға әкелуі мүмкін екенін көрсету үшін қолданамыз.
Осы мысалдардың екеуі де көптеген пайымдаулар жасайтын көптеген адамдарды зерттеуді қамтиды. Бірақ көптеген маңызды пайымдаулар қайталанатын емес, бірегей болып табылады: бірегей бизнес мүмкіндігін қалай пайдалану керек, мүлдем жаңа өнімді шығару керек пе, пандемиямен қалай күресу керек немесе стандартты талаптарға сай келмейтін адамды жұмысқа алу керек пе. Осындай бірегей жағдайлар туралы шешімдерден шуды табуға бола ма? Мұндай жерде шу жоқ деп ойлауға болады. Өйткені, шу — бұл қажетсіз құбылмалылық, ал бірегей шешімдерде құбылмалылық қалай болуы мүмкін? 3-тарауда біз осы сұраққа жауап беруге тырысамыз. Сіздің тіпті бірегей болып көрінетін жағдайда жасаған пайымдауыңыз — бұл мүмкіндіктер жиынтығының бірі ғана. Сіз ол жерден де көптеген шу табасыз.
Осы үш тараудан туындайтын негізгі ойды бір сөйлеммен қорытындылауға болады және бұл осы кітаптың негізгі тақырыбы болады: қай жерде пайымдау болса, сол жерде шу бар — және ол сіз ойлағаннан да көп. Оның қаншалықты көп екенін анықтауды бастайық.
1-ТАРАУ
Қылмыс және шулы жаза
Айталық, біреу қылмыс жасағаны үшін сотталды — дүкен ұрлығы, героин сақтау, соққыға жығу немесе қарулы қарақшылық. Жаза қандай болуы мүмкін?
Жауап іс түскен нақты судьяға, сырттағы ауа райының ыстық не суық болуына немесе жергілікті спорт командасының бір күн бұрын жеңген-жеңбегеніне байланысты болмауы керек. Бірдей қылмыс жасаған үш ұқсас адамның мүлдем әртүрлі жаза алуы масқара болар еді: біреуіне шартты жаза, екіншісіне екі жыл түрме, ал үшіншісіне он жыл түрме. Дегенмен, мұндай масқаралықты көптеген елдерден табуға болады — бұл тек өткен заманда ғана емес, бүгін де орын алуда.
Бүкіл әлемде судьялар тиісті жазаны анықтауда бұрыннан үлкен еркіндікке ие болды. Көптеген елдерде сарапшылар бұл еркіндікті қолдап, оны әділетті әрі ізгілікті деп санады. Олар қылмыстық жаза тек қылмысқа ғана емес, сонымен бірге сотталушының мінез-құлқы мен жағдайына байланысты көптеген факторларға негізделуі керек деп сендірді. Жеке ерекшеліктерге қарай жаза кесу басты талап болды. Егер судьялар ережелермен шектелсе, қылмыскерлерге адамгершілікке жатпайтын тұрғыдан қараған болар еді; олар өз жағдайларының егжей-тегжейіне назар аударуға құқылы бірегей тұлға ретінде қабылданбас еді. Көптеген адамдар үшін тиісті заңды процесс идеясының өзі соттың шексіз еркіндігін талап ететіндей көрінді.
Франкель өте қатал бола алатын. Қылмыстық сот төрелігі жүйесіндегі шуға қатысты ол қатты ашуланды. Ол өз мотивациясын былай сипаттайды:
Егер федералды банк тонау бойынша айыпталушы кінәлі деп танылса, ол ең көбі 25 жылға дейін бас бостандығынан айырылуы мүмкін еді. Бұл жазаның 0-ден 25 жылға дейінгі аралықта болуы мүмкін екенін білдірді. Мен бұл мерзімнің нақты қанша болатыны іске немесе жеке айыпталушыға емес, көбінесе нақты судьяға, яғни сол судьяның көзқарастарына, бейімділіктері мен біржақтылығына байланысты екенін тез түсіндім. Осылайша, бір іс бойынша бірдей айыпталушы істің қай судьяға түскеніне байланысты мүлдем әртүрлі үкімдер алуы мүмкін еді.
Франкель өз уәжін қуаттайтын ешқандай статистикалық талдау келтірген жоқ. Бірақ ол ұқсас адамдарға жасалған негізсіз әртүрлі көзқарастарды көрсететін бірқатар әсерлі мысалдарды ұсынды. Екеуінің де бұрын соттылығы жоқ екі адам сәйкесінше 58,40 доллар және 35,20 доллар сомасындағы жалған чектерді қолма-қол ақшаға айналдырғаны үшін сотталды. Бірінші адам он бес жылға, екіншісі 30 күнге бас бостандығынан айырылды. Бір-біріне ұқсас ақша жымқыру істері бойынша бір адамға 117 күн түрме жазасы кесілсе, екіншісі 20 жылға сотталды. Осы тектес көптеген істерге тоқтала отырып, Франкель федералды судьялардың «іс жүзінде бақылаусыз және шексіз өкілеттіктерін» айыптап, мұны «адамдардың емес, заңдардың билігінде» қабылданбайтын, «күн сайын жасалатын ерікті қатыгездік» деп атады.
1970-жылдардың басында жаза отырып, ол «адамдарды машиналармен алмастыруды» қорғауға дейін барған жоқ. Бірақ таңқаларлығы, ол бұған өте жақын келді. Ол «құқық үстемдігі судьяларға да, басқаларға да міндетті, жалпыға бірдей қолданылатын тұлғасыз ережелер жиынтығын талап етеді» деп сенді. Ол үкім кесудегі тәртіпті ойлауға көмекші ретінде «компьютерлерді пайдалануды» ашық түрде жақтады. Сондай-ақ ол үкім кесу жөніндегі комиссия құруды ұсынды.
Франкельдің кітабы қылмыстық құқық тарихындағы ең ықпалды еңбектердің біріне айналды — тек Америка Құрама Штаттарында ғана емес, бүкіл әлемде. Оның жұмысы белгілі бір дәрежеде бейресми сипатта болды. Ол жойқын, бірақ импрессионистік (жалпы әсерге негізделген) еді. Шудың шындығын тексеру үшін бірнеше адам бірден қылмыстық үкімдердегі шу деңгейін зерттеуге кірісті.
Осы тектес алғашқы ауқымды зерттеу 1974 жылы судья Франкельдің өзінің төрағалығымен өтті. Түрлі округтердің елу судьясына бірдей сотқа дейінгі есептерде жинақталған гипотетикалық істер бойынша айыпталушыларға үкім кесу тапсырылды. Негізгі тұжырым «консенсустың (ортақ келісімнің) болмауы қалыпты жағдай» екендігі және жазалаудағы ауытқулардың «таңғалдырарлық» екендігі болды. Героин сатушысы судьяға байланысты бір жылдан он жылға дейін бас бостандығынан айырылуы мүмкін еді. Банк тонаушысына берілетін жаза түрмедегі бес жылдан он сегіз жылға дейінгі аралықты қамтыды. Зерттеу бопсалау ісі бойынша үкімдердің жиырма жылдық бас бостандығынан айыру мен 65 000 доллар айыппұлдан бастап, небәрі үш жылдық түрме жазасына дейін (айыппұлсыз) өзгеретінін анықтады. Ең таңқаларлығы, жиілігі 20 істің 16-сында кез келген түрдегі қамаудың орындылығы туралы бірауыздан келісім болмады.
Бұл зерттеуден кейін басқа да зерттеулер жалғасты, олардың барлығы шудың осындай шокингтік деңгейін анықтады. Мысалы, 1977 жылы Уильям Остин мен Томас Уильямс қырық жеті судья арасында сауалнама жүргізіп, олардан жеңіл қылмыстарды қамтитын бірдей бес іске жауап беруді сұрады. Істердің барлық сипаттамалары судьялар нақты үкім кесуде қолданатын ақпараттың түйіндемелерін қамтыды, мысалы: айып, айғақтар, бұрынғы соттылығы (егер болса), әлеуметтік жағдайы және мінездемеге қатысты дәлелдер. Негізгі тұжырым «айтарлықтай алшақтық» болды. Мысалы, ұрлыққа қатысты істе ұсынылған жазалар бес жылдық түрмеден небәрі отыз күнге дейін (100 доллар айыппұлмен бірге) ауытқыды. Марихуана сақтау ісі бойынша кейбір судьялар түрме мерзімін ұсынса, басқалары шартты жазаны ұсынды.
1981 жылы жүргізілген анағұрлым ауқымды зерттеуге бірдей он алты гипотетикалық іске тап болған 208 федералды судья қатысты. Оның негізгі тұжырымдары таңғалдырды:
16 істің тек 3-інде ғана түрме жазасын тағайындау туралы бірауыздан келісім болды. Тіпті көптеген судьялар түрме жазасы орынды деп келіскен жерде де, ұсынылған түрме мерзімдерінің ұзақтығында айтарлықтай ауытқулар болды. Орташа түрме мерзімі 8,5 жыл болған бір алаяқтық ісінде ең ұзақ мерзім өмір бойына бас бостандығынан айыру болды. Басқа бір істе орташа түрме мерзімі 1,1 жыл болғанымен, ұсынылған ең ұзақ мерзім 15 жыл болды.
Бұл зерттеулер қаншалықты ашық болса да, қатаң бақыланатын эксперименттер болғандықтан, қылмыстық сот төрелігінің нақты әлеміндегі шудың ауқымын әлдеқайда төмендетіп көрсетуі мүмкін. Нақты өмірдегі судьялар осы эксперименттердің мұқият нақтыланған сценарийлерінде зерттеуге қатысушылар алған ақпараттан әлдеқайда көп ақпаратқа ие болады. Бұл қосымша ақпараттың кейбірі, әрине, маңызды, бірақ кішкентай және кездейсоқ факторлар түріндегі маңызды емес ақпараттың нәтижелерде үлкен айырмашылықтар тудыруы мүмкін екендігі туралы көптеген дәлелдер бар. Мысалы, судьялардың мерзімінен бұрын босату туралы өтініштерді жұмыс күнінің басында немесе тамақтану үзілісінен кейін, дәл осындай үзіліс алдындағы уақытқа қарағанда жиірек қанағаттандыратыны анықталды. Егер судьялар аш болса, олар қатаңырақ болады.
Кәмелетке толмағандар ісі жөніндегі мыңдаған сот шешімдерін зерттеу жергілікті футбол командасы демалыс күндері жеңіліп қалғанда, судьялар дүйсенбіде (және аз дәрежеде аптаның қалған бөлігінде) қатаңырақ шешім қабылдайтынын анықтады. Қара нәсілді айыпталушылар бұл артқан қатаңдықтың зардабын пропорционалды емес түрде тартады. Басқа бір зерттеу үш онжылдық ішіндегі 1,5 миллион сот шешімін қарастырып, судьялардың жергілікті қалалық футбол командасы жеңілгеннен кейінгі күндері жеңіске жеткен күндерге қарағанда қатаңырақ болатынын анықтады.
Франциядағы судьялардың он екі жыл ішінде қабылдаған алты миллион шешімін зерттеу айыпталушыларға олардың туған күнінде көбірек жұмсақтық танытылатынын көрсетті. (Бұл айыпталушының туған күні; біз судьялар өз туған күндерінде де жұмсақ болатын шығар деп күдіктенеміз, бірақ білуімізше, бұл гипотеза әлі тексерілген жоқ. ) Тіпті сырттағы температура сияқты маңызды емес нәрсе де судьяларға әсер етуі мүмкін. Төрт жыл ішіндегі 207 000 иммиграциялық сот шешіміне шолу күнделікті температура ауытқуларының айтарлықтай әсерін тапты: сыртта ыстық болғанда, адамдардың баспана алу мүмкіндігі төмендейді. Егер сіз өз еліңізде саяси қуғын-сүргінге ұшырап, басқа жақтан баспана іздесеңіз, тыңдауыңыздың салқын күнге түсуіне үміттеніп, тіпті дұға етуіңіз керек.
Үкім кесудегі шуды азайту
1970-жылдары Франкельдің уәждері және оларды қуаттайтын эмпирикалық тұжырымдар қаза тапқан президент Джон Ф. Кеннедидің ағасы және АҚШ Сенатының ең ықпалды мүшелерінің бірі Эдвард М. Кеннедидің назарына ілікті. Кеннеди бұған қатты таңғалып, шошыды. 1975 жылдың өзінде-ақ ол үкім кесу реформасы туралы заң жобасын ұсынды; бірақ ол еш нәтиже бермеді. Бірақ Кеннеди қайтпады. Дәлелдерге сүйене отырып, ол жыл сайын сол заңнаманың қабылдануын талап етуді жалғастырды. 1984 жылы ол жеңіске жетті. Негізсіз құбылмалылық туралы дәлелдерге жауап бере отырып, Конгресс 1984 жылғы «Үкім кесуді реформалау туралы» заңды қабылдады.
Жаңа заң жүйедегі шуды «заң судьялар мен мерзімінен бұрын босату органдарына үкімдерді тағайындау және орындау үшін беретін шексіз дискрецияны» шектеу арқылы азайтуға бағытталды. Атап айтқанда, Конгресс мүшелері Нью-Йорк аймағында бірдей нақты істер бойынша жазалау шаралары үш жылдан жиырма жылға дейін созылуы мүмкін екендігі туралы тұжырымдарды келтіре отырып, «негізсіз кең» үкім алшақтығына сілтеме жасады. Судья Франкель ұсынғандай, заң АҚШ-тың Үкім кесу жөніндегі комиссиясын құрды, оның негізгі міндеті түсінікті болды: міндетті деп есептелетін және қылмыстық үкімдер үшін шектеулі ауқымды белгілейтін үкім кесу нұсқаулықтарын шығару.
Келесі жылы комиссия бұл нұсқаулықтарды бекітті, олар негізінен он мың нақты істі талдау арқылы ұқсас қылмыстар үшін орташа үкімдерге негізделді. Бұл процесске белсенді қатысқан Жоғарғы соттың судьясы Стивен Брейер комиссия ішіндегі шешілмейтін келіспеушіліктерге сілтеме жасай отырып, өткен тәжірибені пайдалануды қорғады: «Неліктен комиссия отырып, тарихты ғана алмай, бұл нәрсені шынымен рационализацияламады (ақылға қонымды етпеді)? Бұған қысқаша жауап: біздің қолымыздан келмеді. Себебі әр тарапта қарама-қарсы бағыттарды көрсететін өте жақсы уәждер бар... Барлық қылмыстарды жазалану дәрежесіне қарай рет-ретімен тізіп көріңіз... Содан кейін достарыңыздан нәтижелерді жинап, олардың барлығы сәйкес келетінін тексеріңіз. Мен сізге айтайын, олар сәйкес келмейді».
Нұсқаулықтарға сәйкес, судьялар үкім тағайындау үшін екі факторды ескеруі тиіс: қылмыс және айыпталушының қылмыстық тарихы. Қылмыстарға олардың ауырлығына байланысты қырық үш «құқық бұзушылық деңгейінің» бірі беріледі. Айыпталушының қылмыстық тарихы негізінен айыпталушының бұрынғы соттылықтарының саны мен ауырлығын білдіреді. Қылмыс пен қылмыстық тарих біріктірілгеннен кейін, нұсқаулықтар үкім кесудің салыстырмалы түрде тар ауқымын ұсынады, мұнда ауқымның жоғарғы шегі төменгі шегінен алты айдан немесе 25%-дан аспауы тиіс. Судьяларға ауырлататын немесе жеңілдететін жағдайлар ретінде қарастыратын нәрселеріне сілтеме жасай отырып, ауқымнан мүлдем шығуға рұқсат етіледі, бірақ бұл ауытқулар апелляциялық сотта негізделуі керек.
Нұсқаулықтар міндетті болғанымен, олар толығымен қатаң емес. Олар судья Франкель қалағандай деңгейге дейін барған жоқ. Олар судьяларға маневр жасау үшін айтарлықтай орын береді. Соған қарамастан, түрлі әдістерді қолданатын және әртүрлі тарихи кезеңдерге бағытталған бірнеше зерттеулер бірдей қорытындыға келеді: нұсқаулықтар шуды азайтты. Техникалық тілмен айтқанда, олар «үкім кесетін судьяның жеке басының кездейсоқтығына байланысты үкімдегі таза ауытқуды азайтты».
Ең егжей-тегжейлі зерттеу комиссияның өзінен келді. Онда 1985 жылғы (нұсқаулықтар күшіне енгенге дейінгі) банк тонау, кокаин тарату, героин тарату және банк қаражатын жымқыру істері бойынша үкімдер 1989 жылғы 19 қаңтар мен 1990 жылғы 30 қыркүйек аралығында шығарылған үкімдермен салыстырылды. Құқық бұзушылар нұсқаулықтар бойынша үкім кесуге қатысты деп есептелетін факторлар бойынша сәйкестендірілді. Әрбір құқық бұзушылық үшін судьялар арасындағы ауытқулар «Үкім кесуді реформалау туралы» заң іске асырылғаннан кейінгі кезеңде әлдеқайда аз болды.
Басқа бір зерттеуге сәйкес, судьялар арасындағы үкім ұзақтығының күтілетін айырмашылығы 1986 және 1987 жылдары 17% немесе 4,9 ай болған. Бұл көрсеткіш 1988 және 1993 жылдар аралығында 11% немесе 3,9 айға дейін төмендеді. Әртүрлі кезеңдерді қамтитын тәуелсіз зерттеу ұқсас жүктемесі бар судьялар арасындағы орташа үкімдердің айырмашылығы ретінде анықталатын судьялар арасындағы алшақтықтарды азайтуда ұқсас табыстар тапты.
Осы тұжырымдарға қарамастан, нұсқаулықтар қатты сынға ұшырады. Кейбір адамдар, соның ішінде көптеген судьялар кейбір үкімдер тым қатал деп есептеді — бұл шу туралы емес, біржақтылық туралы мәселе. Біздің мақсатымыз үшін көптеген судьялардан келген анағұрлым қызықты қарсылық: нұсқаулықтар мүлдем әділетсіз болды, өйткені олар судьяларға істің ерекшеліктерін тиісті түрде ескеруге тыйым салды. Шуды азайтудың құны шешімдерді қабылданбайтындай механикалық ету болды. Йель заң профессоры Кейт Стит пен федералды судья Хосе Кабранес «қажеттілік соқырлықта емес, түсінікте, әділдікте» деп жазды, бұл «тек жеке істің күрделілігін ескеретін шешімде ғана орын алуы мүмкін».
Бұл қарсылық нұсқаулықтарға қатаң қарсылықтар туғызды, олардың кейбірі заңға, басқалары саясатқа негізделді. Бұл қарсылықтар Жоғарғы сот 2005 жылы осы жерде жинақталған пікірталасқа мүлдем қатысы жоқ техникалық себептермен нұсқаулықтардың күшін жойғанға дейін сәтсіз болды. Сот шешімінің нәтижесінде нұсқаулықтар тек ұсыныс (консультативтік) сипатына ие болды. Айта кетерлігі, Жоғарғы сот шешімінен кейін федералды судьялардың көпшілігі әлдеқайда бақытты болды. Жетпіс бес пайызы ұсыныс режимін жөн көрді, ал тек 3 пайызы ғана міндетті режим жақсырақ деп есептеді.
Нұсқаулықтарды міндеттіліктен ұсынысқа өзгертудің салдары қандай болды? Гарвард заң профессоры Кристал Янг бұл сұрақты экспериментпен немесе сауалнамамен емес, төрт жүз мыңға жуық қылмыстық айыпталушыны қамтитын нақты үкімдердің ауқымды деректер жиынтығымен зерттеді. Оның негізгі тұжырымы — көптеген өлшемдер бойынша 2005 жылдан кейін судьялар арасындағы алшақтықтар айтарлықтай өсті. Нұсқаулықтар міндетті болған кезде, салыстырмалы түрде қатал судья үкім кескен айыпталушылар орташа судья үкім кескенге қарағанда 2,8 айға ұзағырақ жаза алған. Нұсқаулықтар тек ұсыныс сипатына ие болғанда, бұл алшақтық екі есеге артты. Осыдан қырық жыл бұрынғы судья Франкель сияқты Янг былай деп жазады: «менің тұжырымдарым әділдікке қатысты үлкен алаңдаушылық туғызады, өйткені тағайындалған судьяның жеке басы ұқсас қылмыстар үшін сотталған ұқсас құқық бұзушыларға жасалатын әртүрлі мәмілеге айтарлықтай үлес қосады».
Нұсқаулықтар ұсыныс сипатына ие болғаннан кейін, судьялар өздерінің үкім кесу шешімдерін жеке құндылықтарына негіздеуге көбірек бейім болды. Міндетті нұсқаулықтар шуды да, біржақтылықты да азайтады. Жоғарғы соттың шешімінен кейін афроамерикандық айыпталушылар мен дәл сол қылмыс үшін сотталған ақ нәсілді адамдардың үкімдері арасындағы алшақтық айтарлықтай өсті. Сонымен қатар, әйел судьялар ер судьяларға қарағанда өздерінің артқан дискрециясын жұмсақтық пайдасына қолдануға көбірек бейім болды. Демократиялық президенттер тағайындаған судьялар туралы да соны айтуға болады.
2002 жылы Франкель қайтыс болғаннан кейін үш жыл өткен соң, міндетті нұсқаулықтардың күшін жою оның қорқынышты түсіне ұқсас нәрсеге қайта оралуды тудырды: тәртіпсіз заң.

Судья Франкельдің үкім кесу нұсқаулықтары үшін күресі тарихы біз осы кітапта қарастыратын бірнеше негізгі ойларға шолу жасайды. Біріншіден, пайымдау қиын, өйткені әлем күрделі, белгісіз жер. Бұл күрделілік сот жүйесінде айқын көрінеді және кәсіби пайымдауды талап ететін басқа да көптеген жағдайларда орын алады. Жалпы алғанда, бұл жағдайларға дәрігерлер, медбикелер, заңгерлер, инженерлер, мұғалімдер, сәулетшілер, Голливуд басшылары, жалдау комиссияларының мүшелері, кітап баспагерлері, барлық деңгейдегі корпоративтік басшылар және спорт командаларының менеджерлері жасайтын пайымдаулар жатады. Пайымдау бар жерде келіспеушілік міндетті түрде болады.
Екіншіден, бұл келіспеушіліктердің ауқымы біз күткеннен әлдеқайда үлкен. Сот дискрециясы принципіне қарсы шығатындар аз болғанымен, ол тудыратын алшақтықтардың ауқымын барлығы дерлік құптамайды. Жүйелік шу, яғни идеалды түрде бірдей болуы тиіс пайымдаулардағы қажетсіз құбылмалылық, жаппай әділетсіздікті, жоғары экономикалық шығындарды және көптеген қателіктерді тудыруы мүмкін.
Үшіншіден, шуды азайтуға болады. Франкель жақтаған және АҚШ-тың Үкім кесу жөніндегі комиссиясы жүзеге асырған тәсіл — ережелер мен нұсқаулықтар — шуды сәтті азайтатын бірнеше тәсілдердің бірі болып табылады. Басқа тәсілдер пайымдаудың басқа түрлеріне жақсырақ сәйкес келеді. Шуды азайту үшін қабылданған кейбір әдістер бір мезгілде біржақтылықты да азайта алады.
Төртіншіден, шуды азайту әрекеттері жиі қарсылықтар тудырып, елеулі қиындықтарға тап болады. Бұл мәселелер де шешілуі керек, әйтпесе шумен күрес сәтсіздікке ұшырайды.
Үкім кесудегі шу туралы айтсақ
«Эксперименттер судьялардың бірдей істер бойынша ұсынатын үкімдері арасында үлкен алшақтықтар бар екенін көрсетеді. Бұл құбылмалылық әділ болуы мүмкін емес. Айыпталушының үкімі істің кездейсоқ қай судьяға тағайындалғанына байланысты болмауы керек».
«Қылмыстық үкімдер судьяның тыңдау кезіндегі көңіл-күйіне немесе сырттағы температураға байланысты болмауы керек».
«Нұсқаулықтар — бұл мәселені шешудің бір жолы. Бірақ көптеген адамдарға олар ұнамайды, өйткені олар сот дискрециясын шектейді, ал бұл әділдік пен дәлдікті қамтамасыз ету үшін қажет болуы мүмкін. Өйткені әрбір іс бірегей емес пе? »
2-ТАРАУ
Шулы жүйе
Шумен алғашқы кездесуіміз және бұл тақырыпқа алғашқы қызығушылығымыз қылмыстық сот төрелігі жүйесімен кездесу сияқты драмалық болған жоқ. Шын мәнінде, бұл кездесу екеуіміз жұмыс істейтін консалтингтік фирманы жалдаған сақтандыру компаниясына қатысты кездейсоқ жағдай болды.
Әрине, сақтандыру тақырыбы бәріне бірдей қызық емес. Бірақ біздің тұжырымдарымыз шулы шешімдерден көп нәрсені жоғалтуы мүмкін коммерциялық ұйымдағы шу мәселесінің ауқымын көрсетеді. Біздің сақтандыру компаниясымен тәжірибеміз бұл мәселенің неге соншалықты жиі байқалмайтынын және оған қатысты не істеуге болатынын түсіндіруге көмектеседі.
Сақтандыру компаниясының басшылары фирма атынан маңызды қаржылық шешімдер қабылдайтын адамдардың пайымдауларындағы жүйелілікті арттыру — шуды азайту — бойынша жұмыстың әлеуетті құндылығын бағалап жатты. Тұрақтылықтың қажет екендігімен бәрі келісті. Сондай-ақ, бұл пайымдаулар ешқашан толығымен тұрақты бола алмайтындығымен де бәрі келісті, өйткені олар бейресми және ішінара субъективті. Кейбір шудан қашып құтылу мүмкін емес.
Келіспеушілік оның ауқымына келгенде туындады. Басшылар шу олардың компаниясы үшін елеулі мәселе болуы мүмкін екеніне күмәнданды. Дегенмен, олардың абыройына орай, олар бұл мәселені біз шу аудиті (пайымдаулардың қаншалықты ауытқитынын анықтауға арналған тексеріс) деп атайтын қарапайым эксперимент түрімен шешуге келісті. Нәтиже оларды таңғалдырды. Бұл сонымен қатар шу мәселесінің керемет иллюстрациясы болып шықты.
Шу тудыратын лотерея
Кез келген ірі компаниядағы көптеген мамандар компания үшін міндетті пайымдаулар жасауға уәкілетті. Мысалы, бұл сақтандыру компаниясында қаржылық тәуекелдер үшін сыйлықақыларды белгілейтін (мысалы, банкті алаяқтықтан немесе жосықсыз саудадан болатын шығындардан сақтандыру) көптеген андеррайтерлер (тәуекелдерді бағалап, сақтандыру бағасын белгілейтін маман) жұмыс істейді. Онда сондай-ақ болашақ талаптардың құнын болжайтын және даулар туындаған жағдайда талап қоюшылармен келіссөздер жүргізетін көптеген шығындарды реттеушілер жұмыс істейді.
Компанияның әрбір ірі филиалында бірнеше білікті андеррайтер бар. Баға ұсынысы сұралғанда, қол бос кез келген адам оны дайындауға тағайындалуы мүмкін. Іс жүзінде баға ұсынысын анықтайтын нақты андеррайтер лотерея арқылы таңдалады.
Баға ұсынысының нақты мәні компания үшін маңызды салдарға ие. Егер баға ұсынысы қабылданса, жоғары сыйлықақы тиімді, бірақ мұндай сыйлықақы бизнесті бәсекелеске беріп қою қаупін тудырады. Төмен сыйлықақының қабылдану ықтималдығы жоғары, бірақ ол компания үшін тиімділігі азырақ. Кез келген тәуекел үшін Goldilocks price (оңтайлы баға — тым жоғары да, тым төмен де емес, дәл баға) бар және кәсіпқойлардың үлкен тобының орташа пайымдауы осы оңтайлы саннан тым алыс болмауының жақсы мүмкіндігі бар. Осы саннан жоғары немесе төмен бағалар қымбатқа түседі — шулы пайымдаулардың құбылмалылығы компанияның табысына осылайша зиян тигізеді.
Сақтандыру талаптарын реттеушілердің (claims adjusters — сақтандыру жағдайы орын алғанда шығын мөлшерін бағалап, төлемді қадағалайтын маман) жұмысы да компанияның қаржысына әсер етеді. Мысалы, өндірістік жазатайым оқиға салдарынан оң қолын біржола жоғалтқан жұмысшының (талап қоюшы) атынан өтініш түсті делік. Реттеуші бұл іске — дәл андеррайтер сияқты — сол сәтте қолы бос болғандықтан тағайындалады. Реттеуші істің мән-жайын анықтап, оның компания үшін жалпы құнын бағалайды. Содан кейін сол реттеуші талап қоюшының өкілімен келіссөздер жүргізеді; оның мақсаты — талап қоюшының полисте уәде етілген төлемдерді алуын қамтамасыз ету және сонымен бірге компанияны негізсіз артық төлемдерден қорғау.
Алғашқы бағалау өте маңызды, себебі ол реттеуші үшін талап қоюшымен болашақ келіссөздерде жанама мақсатты айқындап береді. Сондай-ақ сақтандыру компаниясы заң бойынша әрбір талаптың болжамды құнын резервте сақтауға (яғни оны төлеуге жететін қолма-қол ақшасы болуына) міндетті. Мұнда да компания тұрғысынан «Алтын алқап» мәні (Goldilocks value) (тым жоғары да емес, тым төмен де емес, оңтайлы көрсеткіш) бар. Келісімге келуге кепілдік жоқ, өйткені екінші тарапта талап қоюшының адвокаты тұр, егер ұсыныс тым аз болса, ол сотқа жүгінуі мүмкін. Екінші жағынан, тым жоғары резерв реттеушіге негізсіз талаптармен келісуге тым көп еркіндік беруі мүмкін. Реттеушінің пайымдауы компания үшін маңызды, ал талап қоюшы үшін одан да маңыздырақ.
Біз нақты бір андеррайтерді немесе реттеушіні таңдаудағы кездейсоқтықтың рөлін атап көрсету үшін лотерея сөзін қолданамыз. Компанияның қалыпты жұмысында бір іске бір ғана маман тағайындалады және оның орнына басқа әріптесі таңдалғанда не боларын ешкім ешқашан біле алмайды.
Лотереялардың өз орны бар және олар әділетсіз болуы міндетті емес. Қабылданған лотереялар кейбір университеттердегі курстар сияқты «игіліктерді» немесе әскери борыш сияқты «міндеттерді» бөлу үшін қолданылады. Олар белгілі бір мақсатқа қызмет етеді. Бірақ біз айтып отырған пайымдау лотереялары ештеңені бөліп жатқан жоқ. Олар тек белгісіздік тудырады. Елестетіп көріңізші: сақтандыру компаниясының андеррайтерлері мүлдем шусыз жұмыс істеп, оңтайлы сыйақыны белгілейді, бірақ содан кейін кездейсоқ құрылғы араласып, клиент көретін бағаны өзгертіп жібереді. Әлбетте, мұндай лотереяны ештеңемен ақтауға болмайды. Сол сияқты, нәтиже кәсіби пайымдау жасау үшін кездейсоқ таңдалған адамның кім екеніне байланысты болатын жүйені де ақтау мүмкін емес.
Шу аудиттері жүйелік шуды әшкерелейді
Қылмыстық жазаны белгілеу үшін нақты бір судьяны немесе команда атынан өнер көрсету үшін жалғыз мергенді таңдайтын лотерея ауытқушылық тудырады, бірақ бұл ауытқушылық көзге көрінбейді. Шу аудиті (noise audit) (кәсіби пайымдаулардағы алшақтықты анықтауға арналған тексеріс) — федералдық судьялардың үкім кесуіне қатысты жүргізілген аудит сияқты — шуды әшкерелеудің жолы болып табылады. Мұндай аудитте бір істі көптеген адамдар бағалайды және олардың жауаптарындағы ауытқушылық айқын көрінеді.
Андеррайтерлер мен талаптарды реттеушілердің пайымдаулары бұл жаттығуға өте қолайлы, өйткені олардың шешімдері жазбаша ақпаратқа негізделген. Шу аудитіне дайындалу үшін компания басшылары әр топқа (андеррайтерлер мен реттеушілер) арналған бес типтік істің егжей-тегжейлі сипаттамасын жасады. Қызметкерлерден әрқайсысы екі немесе үш істі тәуелсіз түрде бағалау сұралды. Оларға зерттеудің мақсаты пайымдауларындағы ауытқушылықты тексеру екені айтылған жоқ.
Мәтінді ары қарай оқымас бұрын, келесі сұрақтарға өз жауабыңызды ойлап көріңіз: Жақсы басқарылатын сақтандыру компаниясында екі білікті андеррайтерді немесе реттеушіні кездейсоқ таңдасаңыз, олардың бір іске берген бағаларында қаншалықты айырмашылық болады деп күтесіз? Нақтырақ айтқанда, екі бағаның айырмашылығы олардың орташа мәнінің неше пайызын құрауы мүмкін?
Біз компанияның көптеген басшыларынан осы сұраққа жауап алдық, ал кейінгі жылдары әртүрлі мамандықтағы адамдардың да болжамдарын жинадық. Таңқаларлығы, бір жауап басқаларына қарағанда әлдеқайда танымал болды. Сақтандыру компаниясы басшыларының көпшілігі 10% немесе одан аз деп болжады. Біз әртүрлі салалардан 828 бас директор мен жоғары лауазымды тұлғалардан осындай сараптамалық пайымдауларда қандай ауытқу болады деп күтетінін сұрағанда, 10% медианалық әрі ең жиі кездесетін жауап болды (екінші орында 15%). 10%-дық айырмашылық, мысалы, бір андеррайтер сыйақыны $9,500 деп белгілесе, екіншісі $10,500 деп көрсеткенін білдіреді. Бұл елеусіз айырмашылық емес, бірақ ұйым мұндайға төзе алады деп күтіледі.
Біздің шу аудитіміз әлдеқайда үлкен айырмашылықтарды анықтады. Біздің өлшеміміз бойынша, андеррайтингтегі медианалық айырмашылық 55% құрады, бұл көптеген адамдардың, соның ішінде компания басшыларының күткенінен шамамен бес есе көп. Бұл нәтиже, мысалы, бір андеррайтер сыйақыны $9,500 деп белгілегенде, екіншісі оны $10,500 емес, $16,700 деп көрсеткенін білдіреді. Талаптарды реттеушілер үшін медианалық көрсеткіш 43% болды. Біз бұл нәтижелер медиана екенін ерекше атап өтеміз: істер жұптарының жартысында екі пайымдаудың айырмашылығы бұдан да үлкен болды.
Біз шу аудитінің нәтижелерін баяндаған басшылар шудың осыншалықты көлемі қымбатқа түсетін мәселе екенін тез түсінді. Бір жоғары лауазымды басшы андеррайтингтегі шудың компанияға жыл сайынғы шығыны — тым жоғары баға салдарынан клиенттерден айырылуды да, тым төмен бағаланған келісімшарттардан болатын шығындарды да есептегенде — жүздеген миллион долларды құрайтынын айтты.
Нақты қанша қателік (немесе қаншалықты бұрмалау) болғанын ешкім дөп басып айта алмады, өйткені әр іс үшін «Алтын алқап» мәнін ешкім нақты білмеді. Бірақ нысананың дәл ортасын көрмей-ақ, оның сыртқы жағындағы шашыраңқы іздерді өлшеп, бұл ауытқушылықтың мәселе екенін түсінуге болады. Деректер көрсеткендей, тұтынушы төлейтін баға оның транзакциясымен айналысатын қызметкерді таңдайтын «лотереяға» тым қатты тәуелді. Тұтынушылар өздерінің келісімінсіз мұндай лотереяға қатысып жатқанын естісе, қуана қоймасы анық. Жалпы алғанда, ұйымдармен істес болатын адамдар сенімді әрі тұрақты пайымдаулар беретін жүйені күтеді. Олар жүйелік шуды күтпейді.
Қажетсіз ауытқушылық пен қажетті әртүрлілік
Жүйелік шудың айқындаушы белгісі — оның қажетсіз (unwanted) екендігі және біз пайымдаулардағы ауытқушылықтың әрдайым қажетсіз емес екенін дәл осы жерде атап өтуіміз керек.
Талғам немесе қалау мәселелерін қарастырайық. Егер он киносыншы бір фильмді көрсе, он дегустатор бір шарапты бағаласа немесе он адам бір романды оқыса, біз олардың бірдей пікірде болуын күтпейміз. Талғамдардың әртүрлілігі құпталады және толықтай күтілетін нәрсе. Ешкім де барлық адамның ұнатуы мен ұнатпауы бірдей болатын әлемде өмір сүргісі келмейді. (Дерлік ешкім. ) Бірақ жеке талғам кәсіби пайымдаумен шатастырылса, талғам әртүрлілігі қателіктерге себеп болуы мүмкін. Егер фильм продюсері ерекше жобаны (айталық, дисклі телефонның өрлеуі мен құлауы туралы) сценарий өзіне ұнағандықтан ғана бастауға шешім қабылдаса, бірақ ол басқа ешкімге ұнамаса, ол үлкен қателік жасаған болуы мүмкін.
Пайымдаулардағы ауытқушылық ең жақсы шешімдер марапатталатын бәсекелестік жағдайында да күтіледі және құпталады. Бірнеше компания (немесе бір ұйымдағы бірнеше команда) бір тұтынушының мәселесін шешу үшін инновациялық шешімдер ұсынуға жарысқанда, біз олардың бір ғана тәсілге назар аударғанын қаламаймыз. Ғылыми мәселемен, мысалы, вакцина әзірлеумен айналысатын бірнеше зерттеушілер тобына да солай: біз олардың мәселеге әртүрлі қырдан қарағанын қалаймыз. Тіпті болжамшылар да кейде бәсекелес ойыншылар сияқты әрекет етеді. Ешкім күтпеген рецессияны дөп басқан талдаушы танымал болады, ал жалпы консенсустан ешқашан ауытқымайтын талдаушы белгісіз болып қала береді. Мұндай жағдайларда идеялар мен пайымдаулардағы ауытқушылық құпталады, өйткені ауытқушылық — тек бірінші қадам. Екінші кезеңде бұл пайымдаулардың нәтижелері бір-бірімен соқтығысып, ең жақсысы жеңіске жетеді. Нарықта да, табиғатта да сұрыптау ауытқушылықсыз жүзеге аспайды.
Талғам мәселелері мен бәсекелестік жағдайлары пайымдаудың қызықты мәселелерін тудырады. Бірақ біздің назарымызда ауытқушылық қажетсіз болатын пайымдаулар тұр. Жүйелік шу — бұл нарықтардың емес, ұйымдар болып табылатын жүйелердің мәселесі. Трейдерлер акция құнын әртүрлі бағалағанда, олардың кейбіреуі ақша табады, ал басқалары таппайды. Келіспеушіліктер нарықты құрайды. Бірақ егер сол трейдерлердің бірі өз фирмасының атынан бағалау жасау үшін кездейсоқ таңдалса және оның сол фирмадағы әріптестері мүлдем басқаша бағалаулар жасайтыны анықталса, онда фирма жүйелік шумен бетпе-бет келеді және бұл — мәселе.
Біз өз нәтижелерімізді активтерді басқару фирмасының аға менеджерлеріне таныстырғанда, бұл мәселенің тамаша көрінісі пайда болды және оларды өздерінің барлаушы шу аудитін жүргізуге итермеледі. Олар фирманың 42 тәжірибелі инвесторынан акцияның әділ құнын (инвестор сатып алуға немесе сатуға бейжай қарайтын баға) бағалауды сұрады. Инвесторлар өз талдауларын бизнестің бір беттік сипаттамасына негіздеді; деректерге соңғы үш жылдағы ықшамдалған пайда мен шығын, баланс және ақша қаражатының қозғалысы туралы есептер мен алдағы екі жылға арналған болжамдар енгізілді. Сақтандыру компаниясындағыдай әдіспен өлшенген медианалық шу 41% болды. Бір фирмадағы, бірдей бағалау әдістерін қолданатын инвесторлар арасындағы мұндай үлкен айырмашылықтар жақсы жаңалық бола алмайды.
Пайымдау жасайтын адам бірдей білікті адамдар тобынан кездейсоқ таңдалатын кез келген жерде — осы активтерді басқару фирмасында да, қылмыстық сот жүйесінде де, жоғарыда айтылған сақтандыру компаниясында да — шу мәселе болып табылады. Жүйелік шу көптеген ұйымдарды жайлайды: ауруханада сізді қай дәрігер қабылдайтынын, сот залында ісіңізді қай судья қарайтынын, өтінішіңізді қай патенттік сарапшы тексеретінін, шағымыңызды тұтынушыларға қызмет көрсетудің қай өкілі тыңдайтынын көбіне кездейсоқ тағайындау процесі шешеді. Бұл пайымдаулардағы қажетсіз ауытқушылық елеулі мәселелерге, соның ішінде қаржылық шығындарға және жаппай әділетсіздікке әкелуі мүмкін.
Пайымдаулардағы қажетсіз ауытқушылық туралы жиі кездесетін қате түсінік — бұл маңызды емес, өйткені кездейсоқ қателіктер бірін-бірі жояды деген ой. Әрине, бір іске қатысты пайымдаудағы оң және теріс қателіктер бірін-бірі теңестіруге бейім және біз бұл қасиетті шуды азайту үшін қалай қолдануға болатынын егжей-тегжейлі талқылаймыз. Бірақ шулы жүйелер бір іс бойынша бірнеше пайымдау жасамайды. Олар әр түрлі істер бойынша шулы пайымдаулар жасайды. Егер бір сақтандыру полисінің бағасы тым жоғары, ал екіншісінікі тым төмен болса, баға белгілеу орташа алғанда дұрыс көрінуі мүмкін, бірақ сақтандыру компаниясы екі бірдей қымбат қателік жасады. Егер екі қылмыскердің әрқайсысы бес жылға бас бостандығынан айырылуы керек болса, бірақ олардың бірі үш жыл, ал екіншісі жеті жыл алса, орташа алғанда әділдік орнаған жоқ. Шулы жүйелерде қателіктер бірін-бірі жоймайды. Олар қосылады.
Келісім иллюзиясы
Бірнеше онжылдықтарға созылатын көлемді әдебиеттер кәсіби пайымдаулардағы шуды құжаттаған. Біз бұл әдебиеттермен таныс болғандықтан, сақтандыру компаниясының шу аудитінің нәтижелері бізді таң қалдырмады. Алайда, біз нәтижелерді баяндаған басшылардың реакциясы бізді таң қалдырды: компанияда ешкім біз байқаған шудың мұндай көлемін күтпеген еді. Аудиттің дұрыстығына ешкім күмән келтірген жоқ және ешкім байқалған шу көлемін қалыпты деп айтқан жоқ. Соған қарамастан, шу мәселесі және оның орасан шығыны ұйым үшін мүлдем жаңа дүниедей көрінді. Шу жертөледегі судың ағуы сияқты болды. Оған төзіп келгені — оны қалыпты деп санағандықтан емес, оны байқамағандықтан еді.
Бұл қалай болуы мүмкін? Бір рөлдегі және бір кеңседегі мамандар мұны байқамай, бір-бірінен қалайша осыншалықты алшақтай алады? Басшылар өз компаниясының беделі мен тиімділігіне үлкен қауіп төндіретін бұл жағдайды қалай байқамады? Біз жүйелік шу мәселесі ұйымдарда көбіне танылмайтынын және шуға деген бұл жалпы немқұрайлылық оның таралуы сияқты қызықты екенін түсіндік. Шу аудиттері көрсеткендей, құрметті мамандар және оларды жұмысқа алған ұйымдар күнделікті кәсіби пайымдауларында іс жүзінде келіспесе де, келісім иллюзиясын сақтап келген.
Келісім иллюзиясының қалай пайда болатынын түсіну үшін өзіңізді қалыпты жұмыс күніндегі андеррайтердің орнына қойып көріңіз. Сіздің бес жылдан астам тәжірибеңіз бар, әріптестеріңіздің арасында беделді екеніңізді білесіз, оларды сыйлайсыз және жақсы көресіз. Өз ісіңіздің шебері екеніңізді білесіз. Қаржы фирмасы бетпе-бет келген күрделі тәуекелдерді мұқият талдағаннан кейін, сіз $200,000 көлеміндегі сыйақы орынды деген қорытындыға келесіз. Мәселе күрделі, бірақ сіз күнделікті шешіп жүрген мәселелерден аса айырмашылығы жоқ.
Енді сізге кеңседегі әріптестеріңізге де дәл осындай ақпарат берілгенін және олардың да сол тәуекелді бағалағанын айтты делік. Олардың кем дегенде жартысы $255,000-нан жоғары немесе $145,000-нан төмен сыйақы белгіледі дегенге сене аласыз ба? Бұл ойды қабылдау қиын. Расында да, біз шу аудиті туралы естіген және оның дұрыстығын мойындаған андеррайтерлер оның қорытындылары өздеріне жеке қатысты деп ешқашан шын жүректен сенген жоқ деп ойлаймыз.
Көбіміз уақытымыздың басым бөлігінде «әлем біз көріп тұрғандай, өйткені ол дәл сондай» деген күмәнсіз сеніммен өмір сүреміз. Осы сенімнен келесі сенімге дейін бір-ақ қадам бар: «Басқа адамдар да әлемді мен сияқты көреді». Наивті реализм (naive realism) (әлемді қалай болса, солай объективті түрде көремін деген сенім) деп аталатын бұл нанымдар біздің басқа адамдармен бөлісетін шынайылық сезіміміз үшін өте маңызды. Біз бұл нанымдарға сирек күмән келтіреміз. Біз кез келген уақытта айналамыздағы әлемнің бір ғана интерпретациясын ұстанамыз және әдетте оған балама нұсқаларды жасауға аз күш жұмсаймыз. Бір интерпретация жеткілікті және біз оны шындық ретінде қабылдаймыз. Біз өмір бойы өзіміз көрген нәрсені көрудің балама жолдарын елестетіп жүрмейміз.
Кәсіби пайымдаулар жағдайында «басқалар әлемді біз сияқты көреді» деген сенім күн сайын бірнеше жолмен нығая түседі. Біріншіден, біз әріптестерімізбен ортақ тілде сөйлесеміз және шешім қабылдауда не нәрсе маңызды болуы керектігі туралы ережелер жиынтығын бөлісеміз. Сондай-ақ осы ережелерді бұзатын пайымдаулардың қисынсыздығы туралы басқалармен келіскенде сенімділікке ие боламыз. Әріптестермен болатын сирек келіспеушіліктерді олардың тарапынан болған қателік деп қараймыз. Біз келісілген ережелеріміздің бұлыңғыр екенін, олардың кейбір мүмкіндіктерді жоққа шығаруға жеткілікті болғанымен, нақты бір жағдайға ортақ оң жауапты анықтауға жеткіліксіз екенін байқай бермейміз. Біз әріптестерімізбен олардың әлемді біз сияқты көрмейтінін ешқашан байқамай-ақ жайлы өмір сүре аламыз.
Біз сөйлескен бір андеррайтер өзінің бөлімде ардагерге айналу тәжірибесін былай сипаттады: «Жаңа келген кезімде мен істердің 75 пайызын жетекшіммен талқылайтынмын... Бірнеше жылдан кейін бұған қажеттілік болмады — қазір мені сарапшы ретінде санайды... Уақыт өте келе мен өз пайымдауыма көбірек сенімді бола бастадым». Көбіміз сияқты, бұл адам да өз пайымдауына деген сенімді негізінен оны жүзеге асыру арқылы дамытқан.
Бұл процестің психологиясы жақсы зерттелген. Сенімділік пайымдаулардың барынша оңай әрі еркін жасалуының субъективті тәжірибесінен туындайды, бұл ішінара олардың өткендегі ұқсас істер бойынша жасалған пайымдауларға ұқсастығынан болады. Уақыт өте келе, бұл андеррайтер өзінің өткендегі шешімдерімен келісуді үйренген сайын, оның өз пайымдауларына деген сенімі артты. Ол алғашқы үйрену кезеңінен кейін басқалармен келісуді үйренгеніне, олармен қаншалықты келісетінін тексергеніне немесе тіпті өз іс-тәжірибесінің әріптестерінікінен алшақтап кетпеуін қадағалағанына ешқандай белгі бермеді.
Сақтандыру компаниясы үшін келісім иллюзиясы тек шу аудиті арқылы ғана тас-талқан болды. Компания басшылары өздерінің шу мәселесінен қалайша бейхабар болып келген? Мұның бірнеше ықтимал жауаптары бар, бірақ көптеген жағдайларда үлкен рөл атқаратын нәрсе — келіспеушіліктің ыңғайсыздығы. Ұйымдардың көпшілігі келіспеушілік пен қақтығыстан гөрі консенсус пен үйлесімділікті жөн көреді. Қолданыстағы процедуралар көбінесе нақты келіспеушіліктермен бетпе-бет келу жиілігін азайтуға және мұндай келіспеушіліктер орын алған жағдайда оларды ақтауға арналғандай көрінеді.
Миннесота университетінің психология профессоры және өнімділікті болжау саласындағы жетекші зерттеуші Натан Кунцель бізге осы мәселені көрсететін бір оқиғаны айтып берді. Кунцель бір мектептің қабылдау комиссиясына олардың шешім қабылдау процесін қайта қарауға көмектесіп жүрген еді. Басында бір адам өтініш файлын оқып, оған баға беріп, содан кейін оны бағаларымен бірге екінші оқырманға тапсыратын, ол да өз бағасын беретін. Кунцель — бұл кітап бойында айқын болатын себептермен — екінші оқырманға әсер етпеу үшін бірінші оқырманның бағаларын жасырып қоюды ұсынды. Мектептің жауабы: «Біз бұрын солай істейтінбіз, бірақ бұл өте көп келіспеушіліктер тудырғандықтан, қазіргі жүйеге көштік». Дұрыс шешім қабылдаудан гөрі қақтығыстан қашуды маңыздырақ деп санайтын ұйым тек бұл мектеп емес.
Көптеген компаниялар жүгінетін тағы бір механизмді қарастырыңыз: сәтсіз пайымдауларды талдау (postmortems). Үйрену механизмі ретінде бұл пайдалы. Бірақ егер қателік шынымен жіберілсе — пайымдау кәсіби нормалардан тым алшақтап кетсе — оны талқылау қиын болмайды. Сарапшылар пайымдаудың консенсустан тым алыс екенін оңай анықтайды. (Олар мұны сирек кездесетін ерекше жағдай ретінде де қарастыруы мүмкін). Жаман пайымдауды анықтау жақсы пайымдауды анықтаудан әлдеқайда оңай. Өрескел қателіктерді атап өту және нашар әріптестерді шеттету мамандарға жалпылама қолайлы пайымдаулар жасау кезінде қаншалықты келіспейтінін түсінуге көмектеспейді. Керісінше, нашар пайымдаулар бойынша оңай қол жеткізілген консенсус келісім иллюзиясын нығайта түсуі де мүмкін. Ал жүйелік шудың барлық жерде болатыны туралы шынайы сабақ ешқашан алынбайды.
Біз сіздің де жүйелік шу — үлкен мәселе деген пікірімізге қосыла бастағаныңызға үміттенеміз. Оның болуы таңқаларлық емес; шу — пайымдаудың бейресми сипатының салдары. Дегенмен, осы кітап бойында көретініміздей, ұйым бұған байыппен қарағанда байқалатын шудың мөлшері әрдайым дерлік есеңгіретеді. Біздің қорытындымыз қарапайым: пайымдау бар жерде шу да бар және ол сіз ойлағаннан да көп.
Сақтандыру компаниясындағы жүйелік шу туралы айтсақ:
«Біз андеррайтерлердің, талаптарды реттеушілердің және басқалардың кәсіби пайымдауларының сапасына тәуелдіміз. Біз әрбір істі бір сарапшыға тапсырамыз, бірақ басқа сарапшы да дәл сондай пайымдау жасайды деген қате тұжырыммен жұмыс істейміз». «Жүйелік шу біз ойлағаннан немесе біз төзе алатын мөлшерден бес есе көп. Шу аудитінсіз біз мұны ешқашан түсінбес едік. Шу аудиті келісім иллюзиясын тас-талқан етті». «Жүйелік шу — үлкен мәселе: ол бізге жүздеген миллионға түсуде». «Пайымдау бар жерде шу да бар — және ол біз ойлағаннан да көп».
OceanofPDF. com
3-ТАРАУ
Бірегей шешімдер
Осы уақытқа дейін біз талқылаған кейс-стадилер қайталанып жасалатын пайымдауларға қатысты болды. Ұрлық жасағаны үшін сотталған адамға қандай жаза дұрыс? Белгілі бір тәуекел үшін қандай сыйақы орынды? Әрбір жағдай белгілі бір мағынада бірегей болғанымен, бұл сияқты пайымдаулар қайталанатын шешімдер (recurrent decisions) болып табылады.
Қайталанатын шешімдердегі шу алдыңғы тарауда таныстырған шу аудиті арқылы дәлелденеді. Бірін-бірі алмастыра алатын мамандар ұқсас жағдайларда шешім қабылдағанда, қажетсіз ауытқушылықты анықтау және өлшеу оңай. Шу идеясын біз бірегей шешімдер (singular decisions) деп атайтын пайымдаулар категориясына қолдану әлдеқайда қиын, тіпті мүмкін емес сияқты көрінеді.
Мысалы, 2014 жылы әлем бетпе-бет келген дағдарысты қарастырып көрейік. Батыс Африкада Эбола індетінен көптеген адамдар қайтыс болды. Әлем өзара тығыз байланысты болғандықтан, болжамдар инфекцияның бүкіл дүние жүзіне тез таралып, Еуропа мен Солтүстік Америкаға ерекше ауыр соққы болатынын көрсетті. Америка Құрама Штаттарында зардап шеккен аймақтардан әуе қатынасын тоқтату және шекараларды жабу үшін қатаң шаралар қолдану туралы табанды талаптар қойылды. Бұл бағытта әрекет ету үшін саяси қысым өте күшті болды, тіпті беделді әрі хабардар адамдар да осы қадамдарды қолдады.
Президент Барак Обама өз президенттігіндегі ең қиын шешімдердің біріне тап болды — ол бұрын-соңды мұндай жағдайды көрмеген және кейін де кездестірмеген еді. Ол ешқандай шекараны жаппау туралы шешім қабылдады. Оның орнына Батыс Африкаға үш мың адамды — медицина қызметкерлері мен сарбаздарды жіберді. Ол әрдайым үйлесімді жұмыс істей бермейтін әртүрлі халықаралық коалицияны басқарып, олардың ресурстары мен тәжірибесін мәселенің ошағында шешуге жұмылдырды.
Жеке-дара және қайталанатын шешімдер
Президенттің Эболаға берген жауабы сияқты бір рет қана қабылданатын шешімдер жеке-дара (singular) шешімдер (бір реттік, бірегей сипаттағы таңдаулар) деп аталады, өйткені оларды бір адам немесе команда қайталап қабылдамайды, олардың дайын шешімдер жиынтығы жоқ және олар нағыз бірегей белгілермен сипатталады. Эболамен күресуде Президент Обама мен оның командасының сүйенетін нақты прецеденттері болған жоқ. Маңызды саяси шешімдер, сондай-ақ әскери қолбасшылардың тағдыршешті таңдаулары жеке-дара шешімдердің айқын мысалы болып табылады.
Жеке өмірде жұмыс таңдау, үй сатып алу немесе үйлену туралы ұсыныс жасау сияқты шешімдер де осындай сипаттарға ие. Бұл сіздің алғашқы жұмысыңыз, үйіңіз немесе некеңіз болмаса да және сансыз адамдар бұрын осындай таңдауларға тап болса да, шешім сіз үшін бірегей болып көрінеді. Бизнесте де компания басшыларына бірегей болып көрінетін шешімдер жиі ұсынылады: ойын ережесін өзгертетін инновацияны енгізу керек пе, пандемия кезінде қызметті қаншалықты тоқтату қажет, шет елде кеңсе ашу керек пе немесе оларды реттеуге тырысатын үкіметке көну керек пе.
Жеке-дара және қайталанатын шешімдердің арасында нақты жік емес, үздіксіз байланыс бар деуге болады. Андеррайтерлер (сақтандыру тәуекелдерін бағалайтын мамандар) кейде әдеттегіден тыс жағдайларға тап болуы мүмкін. Керісінше, егер сіз өміріңізде төртінші рет үй сатып алсаңыз, үй алуды қайталанатын шешім деп санай бастауыңыз ықтимал. Бірақ төтенше мысалдар айырмашылықтың маңызды екенін анық көрсетеді. Соғысқа бару — бір бөлек, жылдық бюджетті қарау — мүлдем басқа нәрсе.
Жеке-дара шешімдердегі шу
Жеке-дара шешімдер дәстүрлі түрде ірі ұйымдардағы қызметкерлердің күнделікті қабылдайтын қайталанатын пайымдауларынан бөлек қарастырылып келді. Әлеуметтанушылар қайталанатын шешімдермен айналысқанда, жоғары бәс тігілген жеке-дара шешімдер тарихшылар мен менеджмент гуруларының құзырында болды. Бұл екі түрлі шешімге деген көзқарастар да айтарлықтай ерекшеленді. Қайталанатын шешімдерді талдау көбінесе статистикалық бағытты ұстанады: әлеуметтанушылар заңдылықтарды анықтау, жүйелілікті табу және дәлдікті өлшеу үшін көптеген ұқсас шешімдерді бағалайды. Керісінше, жеке-дара шешімдерді талқылау әдетте себеп-салдарлық көзқарасты қолданады; олар өткенге көз жүгірту арқылы жүргізіледі және болған оқиғаның себептерін анықтауға бағытталады. Тарихи талдаулар, менеджменттегі сәттіліктер мен сәтсіздіктерді зерттеу (кейстер) сияқты, бірегей пайымдаудың қалай жасалғанын түсінуді мақсат етеді.
Жеке-дара шешімдердің табиғаты шуды зерттеу үшін маңызды сұрақ тудырады. Біз шуды бір мәселені пайымдау кезіндегі қажетсіз ауытқу (вариабельділік) деп анықтадық. Жеке-дара мәселелер ешқашан дәл қайталанбайтындықтан, бұл анықтама оларға қолданылмайды. Қалай болғанда да, тарих тек бір рет қана жүреді. Сіз Обаманың 2014 жылы Батыс Африкаға медицина қызметкерлері мен сарбаздарды жіберу туралы шешімін басқа американдық президенттердің сол уақыттағы дәл сол мәселені қалай шешетінімен ешқашан салыстыра алмайсыз (тек болжам жасауға болады). Сіз өзіңіздің сүйікті адамыңызға үйлену туралы шешіміңізді өзіңізге ұқсас басқа адамдардың шешімдерімен салыстыруға келісуіңіз мүмкін, бірақ бұл салыстыру бір жағдай бойынша андеррайтерлердің бағаларын салыстырғандағыдай маңызды болмайды. Сіз және жұбайыңыз — бірегейсіздер. Жеке-дара шешімдерде шудың бар екенін бақылаудың тікелей жолы жоқ.
Дегенмен, жеке-дара шешімдер қайталанатын шешімдерде шу тудыратын факторлардан ада емес. Тирде С командасының (шулы команда) атқыштары мылтықтарының көздеуішін әртүрлі бағыттарға реттеуі мүмкін немесе олардың қолдары дірілдеуі ықтимал. Егер біз командадағы тек бірінші атқышты ғана бақыласақ, команданың қаншалықты шулы екенін білмейтін едік, бірақ шудың көздері бәрібір сонда қалады. Сол сияқты, сіз жеке-дара шешім қабылдағанда, сізбен бірдей құзыретті, мақсаттары мен құндылықтары бірдей басқа бір адам дәл сол деректерден дәл сондай қорытынды шығармауы мүмкін екенін елестетуіңіз керек. Және шешім қабылдаушы ретінде, егер жағдайдың немесе шешім қабылдау процесінің кейбір маңызды емес аспектілері басқаша болса, сіз де басқа шешім қабылдауыңыз мүмкін екенін түсінуіңіз керек.
Басқаша айтқанда, біз жеке-дара шешімдегі шуды өлшей алмаймыз, бірақ егер біз контрфактуалды (болмаған балама нұсқаларды елестету арқылы ойлау) ойлансақ, шудың сол жерде екенін анық білеміз. Атқыштың дірілдеген қолы бір оқтың басқа жерге тиюі мүмкін екенін білдіретіні сияқты, шешім қабылдаушылар мен шешім қабылдау процесіндегі шу жеке-дара шешімнің басқаша болуы мүмкін екенін білдіреді.
Жеке-дара шешімге әсер ететін барлық факторларды ескеріңіз. Егер Эбола қаупін талдауға және әрекет ету жоспарларын дайындауға жауапты сарапшылардың білімі мен өмірлік тәжірибесі әртүрлі басқа адамдар болса, олардың Президент Обамаға ұсыныстары бірдей болар ма еді? Егер дәл сол фактілер сәл басқаша түрде ұсынылса, әңгіме дәл солай өрбір ме еді? Егер негізгі тұлғалардың көңіл-күйі басқаша болса немесе кездесу қарлы боран кезінде өтсе, соңғы шешім бірдей болар ма еді? Осы тұрғыдан алғанда, жеке-дара шешім алдын ала анықталғандай көрінбейді. Біз тіпті білмейтін көптеген факторларға байланысты шешімнің басқаша болуы әбден мүмкін еді.
Контрфактуалды ойлаудың тағы бір жаттығуы ретінде әртүрлі елдер мен аймақтардың COVID-19 дағдарысына қалай жауап бергенін қарастырыңыз. Тіпті вирус оларға шамамен бір уақытта және ұқсас түрде соққы берсе де, жауаптарда үлкен айырмашылықтар болды. Бұл өзгермелілік әртүрлі елдердің шешім қабылдауындағы шудың айқын дәлелі болып табылады. Бірақ егер індет тек бір елге ғана тисе ше? Онда біз ешқандай өзгермелілікті бақыламас едік. Бірақ біздің өзгермелілікті көре алмауымыз шешімді азырақ шулы етпес еді.
Жеке-дара шешімдердегі шуды бақылау
Бұл теориялық талқылау маңызды. Егер жеке-дара шешімдер қайталанатын шешімдер сияқты шулы болса, онда қайталанатын шешімдердегі шуды азайтатын стратегиялар жеке-дара шешімдердің сапасын да жақсартуы керек.
Бұл көрінгеннен гөрі интуицияға қайшы келетін нұсқау. Сізде бірегей шешім қабылдау қажеттілігі туындағанда, интуицияңыз оған "бірегей" ретінде қарауды талап етеді. Кейбіреулер тіпті ықтималдық ойлау ережелері белгісіздік жағдайында қабылданатын жеке-дара шешімдерге мүлдем қатысы жоқ және мұндай шешімдер түбегейлі басқа көзқарасты қажет етеді деп санайды.
Біздің бақылауларымыз керісінше кеңес береді. Шуды азайту тұрғысынан алғанда, жеке-дара шешім — бұл тек бір рет қана орындалатын қайталанатын шешім. Шешімді бір рет немесе жүз рет қабылдасаңыз да, мақсатыңыз ауытқуды (bias) да, шуды да азайтатындай етіп қабылдау болуы керек. Және қателікті азайтатын әдістер қайталанатын шешімдердегідей, сіздің бірегей шешімдеріңізде де тиімді болуы тиіс.
«Осы ерекше мүмкіндікке келу жолыңыз сізді шуға ұрындырады. »
«Есіңізде болсын: жеке-дара шешім — бұл тек бір рет қана қабылданатын қайталанатын шешім. »
«Сізді тұлға етіп қалыптастырған жеке тәжірибелеріңіз бұл шешімге шынымен қатысты емес. »
ІІ БӨЛІМ: Сіздің санаңыз — өлшеу құралы
Өлшеу — күнделікті өмірде де, ғылымда да нысанға немесе оқиғаға шкала бойынша мән беру үшін аспапты пайдалану әрекеті. Сіз кілемнің ұзындығын рулетка көмегімен дюйммен өлшейсіз. Сіз температураны термометрге қарап Фаренгейт немесе Цельсий градусымен өлшейсіз.
Пайымдау жасау әрекеті де осыған ұқсас. Судьялар қылмыс үшін тиісті түрме мерзімін белгілегенде, олар шкала бойынша мән береді. Андеррайтерлер тәуекелді сақтандыру үшін ақшалай құнын белгілегенде немесе дәрігерлер диагноз қойғанда да солай істейді. (Шкала міндетті түрде сандық болуы шарт емес: «күмәнсіз кінәлі», «асқынған меланома» және «ота жасау ұсынылады» дегендер де пайымдаулар болып табылады. )
Сондықтан пайымдауды құралы адам санасы болып табылатын өлшеу деп сипаттауға болады. Өлшеу ұғымының астарында дәлдікке ұмтылу — шындыққа жақындау және қателікті азайту мақсаты жатыр. Пайымдаудың мақсаты — әсер қалдыру, позицияны ұстану немесе көндіру емес. Айта кететін жайт, мұнда біз қолданып отырған "пайымдау" ұғымы техникалық психологиялық әдебиеттерден алынған және ол күнделікті тілдегі мағынасынан әлдеқайда тар. Пайымдау (judgment) — бұл ойлаудың синонимі емес, ал дәл пайымдау жасау — бұл жақсы түйсікке ие болудың синонимі емес.
Біздің анықтамамыз бойынша, пайымдау — бұл бір сөзбен немесе сөз тіркесімен қорытындылауға болатын түйін. Егер барлау аналитигі режимнің тұрақсыз екендігі туралы қорытындыға әкелетін ұзақ есеп жазса, тек сол қорытынды ғана пайымдау болып табылады. Пайымдау, өлшеу сияқты, пайымдау жасаудың психикалық әрекетіне де, оның нәтижесіне де қатысты. Және біз кейде "судья" (judge) терминін сот жүйесіне ешқандай қатысы болмаса да, пайымдау жасайтын адамдарды сипаттау үшін техникалық термин ретінде қолданамыз.
Дәлдік мақсат болғанымен, бұл мақсатқа жетудегі кемелдікке тіпті ғылыми өлшеулерде де, пайымдауда да ешқашан қол жеткізілмейді. Әрқашан қандай да бір қателік болады, оның бір бөлігі — ауытқу (bias), ал бір бөлігі — шу.
Шу мен ауытқудың қателікке қалай ықпал ететінін сезіну үшін, біз сізді бір минуттан аз уақыт алатын ойын ойнауға шақырамыз.
Егер сізде секундомері бар смартфон болса, онда "lap" (айналым) функциясы болуы мүмкін, ол секундомерді тоқтатпай немесе тіпті дисплейге қарамай-ақ жүйелі уақыт аралықтарын өлшеуге мүмкіндік береді. Сіздің мақсатыңыз — телефонға қарамай, дәл он секундтық бес жүйелі айналым жасау. Бастамас бұрын он секундтық интервалды бірнеше рет бақылап алғыңыз келуі мүмкін. Бастаңыз.
Енді телефоныңызда жазылған айналым ұзақтықтарына қараңыз. (Телефонның өзі шудан ада емес еді, бірақ ондағы шу өте аз болды. ) Сіз айналымдардың бәрі дәл он секунд емес екенін және олардың айтарлықтай ауқымда өзгеретінін көресіз. Сіз дәл сол уақытты қайталауға тырыстыңыз, бірақ оны істей алмадыңыз. Сіз бақылай алмаған бұл өзгермелілік — шудың мысалы.
Бұл нәтиже таңғалдырмайды, өйткені шу физиология мен психологияда әмбебап құбылыс. Жеке тұлғалар арасындағы өзгермелілік — биологиялық заңдылық; бір бұршақ сабағындағы екі бұршақ ешқашан бірдей болмайды. Бір адамның ішінде де өзгермелілік болады. Жүрек соғысыңыз дәлме-дәл жүйелі емес. Сіз бір қимылды мінсіз дәлдікпен қайталай алмайсыз. Сондай-ақ, аудиолог (есту қабілетін тексеретін маман) есту қабілетіңізді тексергенде, сіз ешқашан естімейтін өте ақырын дыбыстар және әрқашан еститін қатты дыбыстар болады. Бірақ кейде еститін, кейде өткізіп алатын дыбыстар да болады.
Енді телефоныңыздағы бес санға қараңыз. Бір заңдылықты көріп тұрсыз ба? Мысалы, бес айналымның бәрі он секундтан қысқа ма, бұл сіздің ішкі сағатыңыздың тез жұмыс істейтінін көрсететін белгі ме? Бұл қарапайым тапсырмада ауытқу (bias) — бұл сіздің айналымдарыңыздың орташа мәні мен он секунд арасындағы оң немесе теріс айырмашылық. Шу сіздің нәтижелеріңіздің өзгермелілігін құрайды, бұл біз бұрын көрген оқтардың шашырауына ұқсас. Статистикада өзгермеліліктің ең көп таралған өлшемі — стандартты ауытқу (standard deviation) (мәліметтердің орташа мәннен таралу деңгейі), және біз оны пайымдаулардағы шуды өлшеу үшін қолданамыз.
Біз пайымдаулардың көбін, атап айтқанда болжамдық пайымдауларды, сіз жаңа ғана жасаған өлшеулерге ұқсас деп санай аламыз. Болжам жасағанда, біз шынайы мәнге жақындауға тырысамыз. Экономикалық болжаушы келесі жылғы жалпы ішкі өнімнің өсуінің нақты мәніне мүмкіндігінше жақын болуды мақсат етеді; дәл сол сияқты дәрігер дұрыс диагноз қоюды мақсат етеді. (Ескерту: осы кітапта қолданылатын техникалық мағынадағы "болжам" термині болашақты болжауды білдірмейді: біздің мақсатымыз үшін бұрыннан бар медициналық жағдайға диагноз қою да болжам болып табылады. )
Біз пайымдау мен өлшеу арасындағы ұқсастыққа көп сүйенеміз, өйткені ол қателіктегі шудың рөлін түсіндіруге көмектеседі. Болжамдық пайымдаулар жасайтын адамдар нысананың ортасын көздейтін атқышқа немесе бөлшектің нақты салмағын өлшеуге тырысатын физикке ұқсайды. Олардың пайымдауларындағы шу қателікті білдіреді. Қарапайым тілмен айтқанда, пайымдау нақты мәнді мақсат еткенде, екі түрлі пайымдаудың екеуі де бірдей дұрыс болуы мүмкін емес. Өлшеу құралдары сияқты, кейбір адамдар нақты тапсырмада басқаларға қарағанда көбірек қателік жібереді — бәлкім, дағдының немесе дайындықтың жетіспеушілігінен. Бірақ, өлшеу құралдары сияқты, пайымдау жасайтын адамдар да ешқашан мінсіз емес. Біз олардың қателіктерін түсініп, өлшеуіміз керек.
Әрине, кәсіби пайымдаулардың көбі уақыт аралығын өлшеуден әлдеқайда күрделі. 4-тарауда біз кәсіби пайымдаулардың әртүрлі түрлерін анықтап, олардың неге бағытталғанын зерттейміз. 5-тарауда қателікті қалай өлшеуге болатынын және жүйелік шудың оған қосқан үлесін қалай анықтауға болатынын талқылаймыз. 6-тарау жүйелік шуға тереңірек үңіліп, оның құрамдас бөліктерін, яғни шудың әртүрлі түрлерін анықтайды. 7-тарауда біз осы құрамдас бөліктердің бірін — жағдайлық шуды (occasion noise) қарастырамыз. Соңында, 8-тарауда топтардың пайымдаулардағы шуды қалай күшейтетінін көрсетеміз.
Осы тараулардан қарапайым қорытынды шығады: өлшеу құралы сияқты, адам санасы да мінсіз емес — ол ауытқулы (biased) әрі шулы (noisy). Неге және қаншалықты? Білейік.
4-ТАРАУ: Пайымдау мәселелері
Бұл кітап кең мағынадағы кәсіби пайымдаулар туралы және ол пайымдау жасайтын кез келген адамның құзыретті екенін және оны дұрыс жасауға тырысатынын негізге алады. Дегенмен, пайымдау ұғымының өзі пайымдаудың дұрыс екеніне ешқашан сенімді бола алмайтындығыңызды еріксіз мойындауды білдіреді.
«Пайымдау мәселесі» немесе «бұл пайымдау шешімі» (нақты ережесі жоқ, бірақ кәсіби біліктілікке сүйенетін түйін) деген тіркестерді қарастырыңыз. Біз ертең күн шығатыны немесе натрий хлоридінің формуласы NaCl екендігі туралы тұжырымды пайымдау мәселесі деп санамаймыз, өйткені саналы адамдар бұл мәселелерде толық келіседі деп күтіледі. Пайымдау мәселесі — бұл жауапта қандай да бір белгісіздік бар және біз саналы әрі құзыретті адамдардың келіспеу мүмкіндігіне жол беретін жағдай.
Бірақ келіспеушіліктің шегі бар. Шындығында, "пайымдау" сөзі негізінен адамдар келісуі керек деп санайтын жерлерде қолданылады. Пайымдау мәселелері бір жағынан фактілер немесе есептеулер туралы сұрақтардан, екінші жағынан талғам немесе пікір мәселелерінен ерекшеленеді. Олар шектелген келіспеушілік күтуімен анықталады.
Пайымдауда қаншалықты келіспеушіліктің қолайлы екендігінің өзі пайымдау шешімі болып табылады және мәселенің қиындығына байланысты болады. Пайымдау абсурд болған кезде келісімге келу оңай. Қарапайым алаяқтық ісі бойынша шығарған үкімдері қатты ерекшеленетін судьялар бір доллар айыппұл мен өмір бойына бас бостандығынан айырудың екеуі де негізсіз екенімен келіседі. Шарап байқауларындағы төрешілер қай шараптардың медаль алуы керектігі туралы қатты ерекшеленеді, бірақ көбінесе жарамсыз деп танылғандарға қатысты жиіркеніштерінде бірауыздан болады.
Пайымдау тәжірибесі: Мысал
Пайымдау тәжірибесін әрі қарай талқыламас бұрын, біз сізден оны өзіңіз жасап көруді сұраймыз. Егер сіз бұл жаттығуды соңына дейін орындасаңыз, осы тараудың қалған бөлігін жақсырақ түсінесіз.
Елестетіп көріңіз, сіз бәсекелестік артып келе жатқан, орташа табысты аймақтық қаржы фирмасының бас директоры лауазымына кандидаттарды бағалауға жауапты команданың мүшесісіз. Сізден келесі кандидаттың екі жыл жұмыс істегеннен кейін сәтті болу ықтималдығын бағалау сұралады. «Сәтті» дегеніміз жай ғана кандидаттың екі жылдың соңында бас директорлық (CEO) жұмысын сақтап қалуы ретінде анықталады. Ықтималдықты 0 (мүмкін емес) мен 100 (анық) арасындағы шкала бойынша көрсетіңіз.
Майкл Гамбарди отыз жеті жаста. Ол он екі жыл бұрын Гарвард бизнес мектебін бітіргеннен бері бірнеше лауазымда жұмыс істеген. Бастапқыда ол екі стартаптың негізін қалаушы және инвестор болды, бірақ олар қаржылық қолдау таппай сәтсіздікке ұшырады. Кейін ол ірі сақтандыру компаниясына қосылып, тез арада Еуропа бойынша аймақтық операциялық директор лауазымына дейін көтерілді. Бұл қызметте ол шағымдарды уақтылы шешуде маңызды жақсартуды бастады және басқарды. Әріптестері мен қарамағындағылар оны тиімді, бірақ сонымен бірге өктем және дөрекі деп сипаттады, оның жұмыс істеген кезеңінде басшылардың ауысуы жиі болды. Әріптестері мен қарамағындағылар оның адалдығын және сәтсіздіктер үшін жауапкершілікті өз мойнына алуға дайын екенін растайды. Соңғы екі жылда ол бастапқыда банкроттық қаупі бар орта көлемдегі қаржы компаниясының бас директоры болып жұмыс істеді. Ол компанияны тұрақтандырды, онда онымен жұмыс істеу қиын болса да, ол сәтті басшы болып саналады. Ол басқа жұмысқа ауысуға мүдделі екенін білдірді. Одан бірнеше жыл бұрын сұхбат алған кадр мамандары оған креативтілігі мен қуаты үшін жоғары баға берді, бірақ оны тәкәппар және кейде қатыгез деп сипаттады.
Есіңізде болсын, Майкл — орташа табысты және бәсекелестік артып келе жатқан аймақтық қаржы фирмасының бас директоры лауазымына кандидат. Егер Майкл жұмысқа алынса, оның екі жылдан кейін әлі де өз орнында қалу ықтималдығы қандай? Әрі қарай оқымас бұрын 0-ден 100-ге дейінгі аралықта нақты бір санды шешіңіз. Қажет болса, сипаттаманы қайта оқыңыз.
Егер сіз бұл тапсырмаға байыпты қарасаңыз, оның қиын екенін байқаған боларсыз. Мұнда көптеген ақпарат бар, олардың көбі бір-біріне қайшы келетіндей көрінеді. Сізге пайымдау жасау үшін қажетті біртұтас әсерді қалыптастыру үшін күресуге тура келді. Ол әсерді қалыптастыру кезінде сіз маңызды болып көрінген кейбір егжей-тегжейлерге назар аудардыңыз және басқаларын елемедіңіз. Егер сізден таңдаған саныңызды түсіндіруді сұраса, сіз бірнеше маңызды фактілерді атар едіңіз, бірақ олар пайымдауыңызды толық негіздеу үшін жеткіліксіз болар еді.
Сіз өткен ойлау процесі біз «пайымдау» деп атайтын психикалық операцияның бірнеше ерекшеліктерін көрсетеді:
- Сипаттамада берілген барлық белгілердің ішінен (олар сізге қажет болуы мүмкін ақпараттың тек бір бөлігі ғана), сіз жасаған таңдауларыңызды толық сезінбестен, кейбіреулеріне басқаларға қарағанда көбірек көңіл бөлдіңіз. Гамбардидің итальяндық тек екенін байқадыңыз ба? Оның қай мектепте оқығаны есіңізде ме? Бұл жаттығу сізге ақпаратты шамадан тыс жүктеу үшін жасалған, сондықтан сіз істің барлық егжей-тегжейін оңай қалпына келтіре алмайсыз. Сіздің есіңізде қалған нәрсе басқа оқырмандардікінен өзгеше болуы әбден мүмкін. Таңдамалы зейін және таңдамалы еске түсіру — адамдар арасындағы өзгермеліліктің (шудың) көзі болып табылады.
- Содан кейін сіз бұл белгілерді Гамбардидің болашағы туралы жалпы әсерге бейресми түрде біріктірдіңіз. Мұндағы түйінді сөз — бейресми. Сіз сұраққа жауап беру үшін арнайы жоспар құрған жоқсыз. Не істеп жатқаныңызды толық сезінбестен, сіздің санаңыз Майклдың күшті және әлсіз жақтары, сондай-ақ оның алдында тұрған қиындықтар туралы біртұтас бейне құрастыруға кірісті. Бейресмилік сізге тез жұмыс істеуге мүмкіндік берді. Бірақ ол сонымен бірге ауытқуды да тудырады: сандар бағанын қосу сияқты ресми процесс бірдей нәтижеге кепілдік береді, ал бейресми операцияда белгілі бір шу (шешімдердегі кездейсоқ ауытқулар) болмай қоймайды.
- Соңында сіз осы жалпы әсерді табысқа жету ықтималдығы шкаласындағы санға айналдырдыңыз. 0 мен 100 арасындағы санды алған әсеріңізге сәйкестендіру — таңғажайып процесс, біз бұған 14-тарауда қайта ораламыз. Тағы да айта кетейік, сіз неге дәл солай жауап бергеніңізді нақты білмейсіз. Неліктен сіз 61 немесе 69 емес, айталық, 65-ті таңдадыңыз? Сірә, белгілі бір сәтте ойыңызға бір сан келді. Сіз ол санның дұрыс-бұрыстығын сезіммен тексердіңіз, егер ол сәйкес келмесе, ойыңызға басқа сан келді. Процестің бұл бөлігі де адамдар арасындағы ауытқудың көзі болып табылады.
Күрделі пайымдау процесіндегі осы үш қадамның әрқайсысы ауытқуды қамтитындықтан, Майкл Гамбарди туралы жауаптарда көптеген шудың болуы бізді таңғалдырмауы керек. Егер сіз бірнеше досыңыздан осы жағдайды оқуды өтінсеңіз, оның табысқа жету ықтималдығы туралы бағаларыңыздың әртүрлі екенін байқайсыз. Біз бұл жағдайды 115 MBA студентіне көрсеткенімізде, олардың Гамбардидің табысқа жету ықтималдығы туралы болжамдары 10-нан 95-ке дейін ауытқыды. Бұл — өте үлкен шу.
Айтпақшы, секундомер жаттығуы мен Гамбарди мәселесі шудың екі түрін көрсететінін байқаған боларсыз. Секундомермен жүргізілген дәйекті сынақтардағы пайымдаулардың ауытқуы — бір ғана төрешінің (сіздің өзіңіздің) ішіндегі шу, ал Гамбарди жағдайындағы пайымдаулардың ауытқуы — әртүрлі төрешілер арасындағы шу. Өлшеу тұрғысынан алғанда, бірінші мәселе жеке тұлғаішілік сенімділікті (бір адамның өз шешімдерінің тұрақтылығы), ал екіншісі тұлғааралық сенімділікті (әртүрлі адамдардың шешімдерінің ұқсастығы) көрсетеді.
Пайымдау неге бағытталған: ішкі сигнал
Сіздің Гамбарди туралы сұраққа берген жауабыңыз біз анықтағандай болжамдық пайымдау болып табылады. Дегенмен, ол біз болжамдық деп атайтын басқа пайымдаулардан (мысалы, ертеңгі Бангкоктағы ең жоғары температура, бүгінгі футбол ойынының нәтижесі немесе келесі президенттік сайлаудың қорытындысы) маңызды жақтарымен ерекшеленеді. Егер сіз осы мәселелер бойынша досыңызбен келіспесеңіз, ерте ме, кеш пе кімнің дұрыс екенін білесіз. Бірақ Гамбарди туралы келіспесеңіз, уақыт кімнің дұрыс болғанын айтып бермейді, себебі қарапайым: Гамбарди өмірде жоқ.
Тіпті сұрақ нақты адамға қатысты болып, біз нәтижені білген күннің өзінде де, бір реттік ықтималдық пайымдауын (0 немесе 100%-дан басқа) растау немесе жоққа шығару мүмкін емес. Нәтиже ex ante (оқиға орын алғанға дейінгі) ықтималдықтың қандай болғанын ашып көрсетпейді. Егер 90% ықтималдық берілген оқиға орын алмаса, бұл пайымдау міндетті түрде қате болды дегенді білдірмейді. Өйткені, болу ықтималдығы небәрі 10% оқиғалар да уақыттың 10 пайызында орын алып тұрады. Гамбарди жаттығуы — тексерілмейтін болжамдық пайымдаудың мысалы, оның екі себебі бар: Гамбарди — ойдан шығарылған кейіпкер және жауап ықтималдыққа негізделген.
Көптеген кәсіби пайымдаулар тексерілмейді. Өрескел қателерді есептемегенде, андеррайтерлер (тәуекелдерді бағалайтын сақтандыру мамандары), мысалы, белгілі бір полис құнының тым жоғары немесе тым төмен болғанын ешқашан біле алмайды. Басқа болжамдар шартты болғандықтан тексерілмеуі мүмкін. «Егер соғыс басталса, біз күл-талқан боламыз» деген маңызды болжам, бірақ ол тексерілмеген күйі қалуы ықтимал (солай болсын деп үміттенеміз). Немесе болжамдар тым ұзақ мерзімді болуы мүмкін, сондықтан оны жасаған мамандар жауапқа тартылмайды — мысалы, жиырма бірінші ғасырдың соңына қарай орташа температураны бағалау сияқты.
Гамбарди тапсырмасының тексерілмейтін сипаты сіздің оған деген көзқарасыңызды өзгертті ме? Мысалы, сіз өзіңізден Гамбардидің шынайы немесе ойдан шығарылған кейіпкер екенін сұрадыңыз ба? Мәтіннің соңында нәтиже белгілі бола ма деп ойландыңыз ба? Тіпті солай болған күннің өзінде, ол ақпарат сіз бетпе-бет келген сұрақтың жауабын бермейтіні туралы ойландыңыз ба? Сірә, жоқ, өйткені сұраққа жауап берген кезде бұл ойлар маңызды болып көрінбеді.
Тексерілу мүмкіндігі пайымдау тәжірибесін өзгертпейді. Белгілі бір дәрежеде сіз жауабы жақын арада белгілі болатын мәселе туралы көбірек ойлануыңыз мүмкін, өйткені қателігіңіздің ашылуынан қорқу зейініңізді жинақтайды. Керісінше, сіз абсурдтық деңгейдегі гипотетикалық мәселе туралы ойланудан бас тартуыңыз мүмкін («Егер Гамбардидің үш аяғы болса және ұша алса, ол жақсырақ бас директор болар ма еді? »). Бірақ, жалпы алғанда, сіз ақылға қонымды гипотетикалық мәселені шынайы мәселемен бірдей шешесіз. Бұл ұқсастық психологиялық зерттеулер үшін өте маңызды, олардың көбі ойдан шығарылған есептерді қолданады.
Нәтиже болмағандықтан — және сіз оның болатыны туралы өзіңізден сұрамаған да боларсыз — сіз сол нәтижеге қатысты қатені азайтуға тырысқан жоқсыз. Сіз пайымдауды дұрыс жасауға, яғни жауап ретінде ұсынуға жеткілікті сенімді болатын санға тоқталуға тырыстыңыз. Әрине, сіз төрт жерде алты жиырма төрт болатынына сенімді болғандай, бұл жауапқа толықтай сенімді болған жоқсыз. Сіз белгілі бір белгісіздікті сезіндіңіз (және біз көретініміздей, ол сіз ойлағаннан да көп болуы мүмкін). Бірақ белгілі бір сәтте сіз бұдан әрі алға баспайтыныңызды түсініп, бір жауапқа тоқтадыңыз.
Пайымдауды дұрыс немесе жауап болуға лайықты деп санауыңызға не себеп болды? Біз бұл сезімді сыртқы ақпаратқа қатысы жоқ пайымдаудың аяқталғаны туралы ішкі сигнал деп атаймыз. Егер жауабыңыз айғақтармен жеткілікті дәрежеде үйлесетін сияқты көрінсе, ол дұрыс болып сезіледі. 0 немесе 100 деген жауап сізге мұндай үйлесімділік сезімін бермес еді: бұл сандар ұялататын сенімділік ұсынылған ретсіз, екіұшты және қарама-қайшы айғақтармен сәйкес келмейді. Бірақ сіз тоқтаған сан, ол қандай болса да, сізге қажетті бірізділік (когеренттілік) сезімін берді. Пайымдаудың мақсаты, сіз оны сезінгендей, бірізді шешімге қол жеткізу болды.
Бұл ішкі сигналдың маңызды ерекшелігі — бірізділік сезімі пайымдау тәжірибесінің бір бөлігі болып табылады. Ол нақты нәтижеге байланысты емес. Соның нәтижесінде ішкі сигнал тексерілетін пайымдаулар сияқты тексерілмейтін пайымдаулар үшін де қолжетімді. Бұл Гамбарди сияқты ойдан шығарылған кейіпкер туралы пайымдау жасаудың неге шынайы әлем туралы пайымдау жасаумен бірдей сезілетінін түсіндіреді.
Пайымдау қалай бағаланады: нәтиже және процесс
Тексерілу мүмкіндігі пайымдау процесі жүріп жатқан кезде оның тәжірибесін өзгертпейді. Дегенмен, ол оқиғадан кейінгі бағалауды өзгертеді.
Тексерілетін пайымдауларды объективті бақылаушы қателіктің қарапайым өлшемі бойынша бағалай алады: пайымдау мен нәтиже арасындағы айырмашылық. Егер синоптик бүгінгі ең жоғары температура Фаренгейт бойынша жетпіс градус болады десе, ал ол алпыс бес градус болса, синоптик плюс бес градус қате жіберді. Әлбетте, бұл тәсіл нақты нәтижесі жоқ Гамбарди мәселесі сияқты тексерілмейтін пайымдаулар үшін жұмыс істемейді. Онда жақсы пайымдауды не құрайтынын қалай шешеміз?
Жауабы мынада: пайымдауларды бағалаудың екінші жолы бар. Бұл тәсіл тексерілетін де, тексерілмейтін де пайымдауларға қолданылады. Ол пайымдау процесін бағалаудан тұрады. Біз жақсы немесе жаман пайымдаулар туралы айтқанда, не нәтиже туралы (мысалы, Гамбарди жағдайында сіз шығарған сан), не процесс туралы — сол санға жету үшін не істегеніңіз туралы айтуымыз мүмкін.
Пайымдау процесін бағалаудың бір жолы — бұл процесс көптеген жағдайларға қолданылғанда оның қалай жұмыс істейтінін бақылау. Мысалы, жергілікті сайлауда көптеген кандидаттардың жеңіске жету ықтималдығын белгілеген саяси болжамшыны алайық. Ол осы кандидаттардың жүзін «жеңіске жету ықтималдығы 70%» деп сипаттады. Егер олардың жетпісі соңында сайланса, бұл болжамшының ықтималдық шкаласын қолданудағы шеберлігінің жақсы көрсеткіші болып табылады. Бірде-бір ықтималдық пайымдауын дұрыс немесе бұрыс деп жариялау мүмкін болмаса да, пайымдаулар жиынтық ретінде тексеріледі. Сол сияқты, белгілі бір топқа қатысты біржақтылықты (bias) жағдайлардың едәуір саны бойынша статистикалық нәтижелерді зерттеу арқылы жақсырақ анықтауға болады.
Пайымдау процесі туралы қойылатын тағы бір сұрақ — оның логика принциптеріне немесе ықтималдықтар теориясына сәйкестігі. Пайымдаудың когнитивті біржақтылығы туралы көптеген зерттеулер осы бағытта жүргізілді.
Нәтижеге емес, пайымдау процесіне назар аудару ойдан шығарылған мәселелер немесе ұзақ мерзімді болжамдар сияқты тексерілмейтін пайымдаулардың сапасын бағалауға мүмкіндік береді. Біз оларды белгілі бір нәтижемен салыстыра алмауымыз мүмкін, бірақ олардың қате жасалған-жасалмаганын бәрібір айта аламыз. Пайымдауларды жай ғана бағалау емес, оларды жақсарту мәселесіне көшкенде де, біз процеске назар аударатын боламыз. Біз осы кітапта біржақтылық пен шуды азайту үшін ұсынатын барлық процедуралар ұқсас жағдайлар жиынтығында қатені барынша азайтатын пайымдау процесін қабылдауға бағытталған.
Біз пайымдауды бағалаудың екі жолын салыстырдық: оны нәтижемен салыстыру және оған алып келген процестің сапасын бағалау. Айта кететін жайт, пайымдау тексерілетін болса, бағалаудың бұл екі жолы бір жағдайда әртүрлі қорытындыларға келуі мүмкін. Ең жақсы құралдар мен әдістерді қолданатын білікті әрі мұқият болжамшы тоқсандық инфляция болжамын жасау кезінде жиі қателеседі. Сонымен қатар, бір тоқсанда дартс лақтырған шимпанзе кейде дұрыс тауып алуы мүмкін.
Шешім қабылдау саласының ғалымдары бұл қайшылықты шешу үшін нақты кеңес береді: бір жағдайдың нәтижесіне емес, процеске назар аударыңыз. Дегенмен, біз бұл нақты өмірде стандартты тәжірибе емес екенін мойындаймыз. Мамандар әдетте олардың пайымдаулары тексерілетін нәтижелерге қаншалықты сәйкес келетініне қарай бағаланады, егер олардан пайымдауларында не нәрсеге ұмтылатынын сұрасаңыз, олар нақты сәйкестік деп жауап береді.
Қорыта айтқанда, адамдар әдетте тексерілетін пайымдауларда нәтижеге сәйкес келетін болжамға ұмтылады. Ал олардың тексерілу мүмкіндігіне қарамастан қол жеткізуге тырысатыны — жағдайдың фактілері мен пайымдау арасындағы бірізділік арқылы берілетін пайымдаудың аяқталғаны туралы ішкі сигнал. Ал нормативтік тұрғыдан алғанда, олар ұқсас жағдайлар жиынтығында ең жақсы нәтиже беретін пайымдау процесіне ұмтылуы керек.
Бағалаушы пайымдаулар
Осы тарауда біз әлі күнге дейін болжамдық пайымдау тапсырмаларына назар аудардық және біз талқылайтын пайымдаулардың көпшілігі осы түрге жатады. Бірақ судья Франкель мен федералды судьялардың үкім кесудегі шуын талқылайтын 1-тарау пайымдаудың тағы бір түрін қарастырады. Қылмыскерге үкім кесу — бұл болжам емес. Бұл — жазаны қылмыстың ауырлығына сәйкестендіруге тырысатын бағалаушы пайымдау. Шарап жәрмеңкесіндегі төрешілер мен мейрамхана сыншылары бағалаушы пайымдаулар жасайды. Эсселерді бағалайтын профессорлар, мәнерлеп сырғанау жарыстарындағы төрешілер және ғылыми жобаларға гранттар беретін комитеттер бағалаушы пайымдаулар жасайды.
Бағалаушы пайымдаудың басқа түрі бірнеше нұсқалар мен олардың арасындағы таңдауды қамтитын шешімдерде жасалады. Жұмысқа кандидаттарды таңдайтын менеджерлерді, стратегиялық нұсқаларды шешуі керек басқару командаларын немесе тіпті Африкадағы эпидемияға қалай әрекет ету керектігін таңдайтын президенттерді елестетіп көріңіз. Әрине, бұл шешімдердің барлығы мәлімет беретін болжамдық пайымдауларға негізделеді — мысалы, кандидат бірінші жылы өзін қалай көрсетеді, қор нарығы белгілі бір стратегиялық қадамға қалай жауап береді немесе эпидемия бақылаусыз қалса, қаншалықты тез таралады. Бірақ түпкілікті шешімдер әртүрлі нұсқалардың артықшылықтары мен кемшіліктері арасындағы таңдауды қажет етеді және бұл таңдаулар бағалаушы пайымдаулар арқылы шешіледі.
Болжамдық пайымдаулар сияқты, бағалаушы пайымдаулар да шектеулі келіспеушілік күтеді. Бірде-бір өзін құрметтейтін федералды судья: «Бұл маған ең ұнайтын жаза, әріптестерімнің басқаша ойлайтыны маған бәрібір», — деп айтпайды. Бірнеше стратегиялық нұсқаларды таңдайтын шешім қабылдаушылар бірдей ақпараты бар және мақсаттары бірдей әріптестері мен бақылаушылар олармен келіседі немесе тым қатты келіспейді деп күтеді. Бағалаушы пайымдаулар ішінара оларды жасаушылардың құндылықтары мен талғамдарына байланысты, бірақ олар тек талғам немесе пікір мәселесі емес.
Сол себепті болжамдық және бағалаушы пайымдаулар арасындағы шекара бұлдыр және пайымдау жасайтын адамдар оны жиі сезбейді. Үкім кесетін судьялар немесе эссе бағалайтын профессорлар өз тапсырмалары туралы терең ойланады және «дұрыс» жауапты табуға тырысады. Олар өз пайымдауларына және олардың негіздемелеріне сенімді болады. Мамандар өз пайымдаулары болжамдық («Бұл жаңа өнім қаншалықты жақсы сатылады? ») немесе бағалаушы («Осы жылы менің көмекшім өзін қалай көрсетті? ») болған кезде де өздерін бірдей сезінеді, бірдей әрекет етеді және өздерін ақтау үшін бірдей сөйлейді.
Шудың несі жаман
Болжамдық пайымдауларда шудың байқалуы әрқашан бірдеңенің дұрыс емес екенін білдіреді. Егер екі дәрігер диагноз бойынша келіспесе немесе екі болжамшы келесі тоқсандағы сатылымдар туралы келіспесе, олардың кем дегенде біреуі қателесуі керек. Қате олардың біреуінің біліктілігі төмен болғандықтан, сондықтан қателесу ықтималдығы жоғары болғандықтан немесе шудың басқа көзінен болуы мүмкін. Себебіне қарамастан, дұрыс пайымдау жасай алмау осы адамдардың диагноздары мен болжамдарына сенетіндер үшін ауыр зардаптарға әкелуі мүмкін.
Бағалаушы пайымдаулардағы шу басқа себеппен проблемалы болып табылады. Төрешілер алмастырылатын және кездейсоқ тағайындалады деп есептелетін кез келген жүйеде бір іс бойынша үлкен келіспеушіліктер әділдік пен бірізділік күтулерін бұзады. Егер бір айыпталушыға берілген үкімдерде үлкен айырмашылықтар болса, біз судья Франкель айыптаған «ерікті қатыгездіктер» саласындамыз. Тіпті жекеленген үкім кесудің құндылығына сенетін және ұрының жазасы бойынша келіспейтін судьялардың өзі пайымдауды лотереяға айналдыратын келіспеушілік деңгейінің проблемалы екенімен келіседі. Дәл осындай жағдай (драмалық деңгейі төмен болса да) бір эссеге мүлдем әртүрлі бағалар қойылғанда, бір мейрамханаға әртүрлі қауіпсіздік рейтингтері берілгенде немесе бір мәнерлеп сырғанаушыға әртүрлі ұпайлар берілгенде немесе депрессиядан зардап шегетін бір адам әлеуметтік мүгедектік бойынша жәрдемақы алып, ал дәл сондай жағдайдағы екінші адам ештеңе алмағанда орын алады.
Әділетсіздік шамалы ғана алаңдаушылық тудырған күннің өзінде, жүйелік шу басқа проблема тудырады. Бағалаушы пайымдаулар әсер ететін адамдар бұл пайымдаулар көрсететін құндылықтар жеке судьялардың емес, жүйенің құндылықтары болады деп күтеді. Егер ақауы бар ноутбукке шағымданған бір тұтынушы ақшасын толық қайтарып алса, ал екіншісі жай ғана кешірім алса; немесе компанияда бес жыл жұмыс істеген бір қызметкер лауазымын көтеруді сұрап, оған қол жеткізсе, ал жұмыс нәтижелері дәл сондай басқа қызметкерге сыпайы түрде бас тартылса, демек бірдеңе қатты дұрыс емес болғаны. Жүйелік шу — бұл бірізділіктің жоқтығы, ал бірізділіктің жоқтығы жүйенің беделіне нұқсан келтіреді.
Жағымсыз, бірақ өлшенетін
Шуды өлшеу үшін бізге бір мәселе бойынша бірнеше пайымдау қажет. Бізге шынайы мәнді білудің қажеті жоқ. Кіріспедегі ату алаңы туралы оқиға көрсеткендей, нысананың артқы жағына қарағанда, ортасы (bull’s-eye) көрінбейді, бірақ біз оқтардың шашырауын көре аламыз. Барлық атқыштардың бір нысананы көздегенін білген бойда біз шуды өлшей аламыз. Шу аудиті осыны істейді. Егер біз барлық болжамшыларымыздан келесі тоқсандағы сатылымдарды бағалауды сұрасақ, олардың болжамдарындағы шашырау — бұл шу.
Біржақтылық пен шу арасындағы бұл айырмашылық пайымдауларды жақсартудың практикалық мақсаты үшін өте маңызды. Пайымдаулардың дұрыстығын тексере алмасақ та, оларды жақсарта аламыз деп айту парадоксалды болып көрінуі мүмкін. Бірақ біз жақсарта аламыз — егер шуды өлшеуден бастасақ. Пайымдаудың мақсаты тек дәлдік пе әлде құндылықтар арасындағы күрделі тепе-теңдік пе, соған қарамастан шу жағымсыз және жиі өлшенетін нәрсе. Шу өлшенгеннен кейін, 5-бөлімде талқылайтынымыздай, оны жиі азайтуға болады.
«Бұл — пайымдау мәселесі. Адамдардың толықтай келісуін күте алмайсыз».
«Иә, бұл пайымдау мәселесі, бірақ кейбір пайымдаулар шындықтан соншалықты алыс, сондықтан олар қате».
«Сенін кандидаттар арасындағы таңдауың салмақты пайымдау емес, жай ғана талғамның көрінісі болды».
«Шешім қабылдау болжамдық та, бағалаушы да пайымдауларды қажет етеді».
5-ТАРАУ Қатені өлшеу
Бірізді біржақтылықтың (bias) шығыны көп қателерге әкелуі мүмкін екені анық. Егер таразы салмағыңызға үнемі белгілі бір мөлшерді қосып көрсетсе, егер ынталы менеджер жобалардың аяқталу уақытын жүйелі түрде екі есе аз деп болжаса немесе жасқаншақ басшы жылдан жылға болашақ сатылымдар туралы тым пессимистік көзқараста болса, нәтижесінде көптеген елеулі қателіктер орын алады.
Біз енді шудың да шығыны көп қателерге әкелетінін көрдік. Егер менеджер көбінесе жобалар нақты уақытынан екі есе аз уақыт алады деп болжаса және кейде олар нақты уақытынан екі есе көп уақыт алады деп болжаса, менеджер «орташа алғанда» дұрыс айтады деудің пайдасы жоқ. Әртүрлі қателер бір-бірін жоймайды, олар жинақталады.
Сондықтан маңызды сұрақ — біржақтылық пен шу қателікке қалай және қаншалықты әсер етеді. Бұл тарау осы сұраққа жауап беруді мақсат етеді. Оның негізгі хабары қарапайым: кез келген түрдегі кәсіби пайымдауларда, мақсат дәлдік болған кезде, біржақтылық пен шу жалпы қатені есептеуде бірдей рөл атқарады. Кейбір жағдайларда негізгі үлесті біржақтылық қосады; басқа жағдайларда бұл шу болады (және бұл жағдайлар күткеннен де жиі кездеседі). Бірақ кез келген жағдайда, шуды азайту жалпы қателікке біржақтылықты дәл сондай мөлшерде азайтумен бірдей әсер етеді. Сол себепті шуды өлшеу және азайту біржақтылықты өлшеу және азайту сияқты жоғары басымдыққа ие болуы керек.
Бұл қорытынды ғылым мен статистикада жалпы қабылданған және ұзақ тарихы бар қатені өлшеудің ерекше тәсіліне негізделген. Бұл тарауда біз сол тарихқа шолу жасап, негізгі қисынды қысқаша баяндаймыз.
GoodSell шуды азайтуы керек пе?
Көптеген сату болжамшыларын жұмысқа алатын GoodSell атты ірі бөлшек сауда компаниясын елестетіңіз. Олардың жұмысы — GoodSell-дің әртүрлі аймақтардағы нарық үлесін болжау. Мүмкін, шу тақырыбындағы кітапты оқығаннан кейін, GoodSell болжау бөлімінің басшысы Эми Симкин шу аудитін өткізген болар. Барлық болжамшылар бір аймақтағы нарық үлесі туралы тәуелсіз бағалаулар жасады.
3-суретте шу аудитінің (тым тегіс) нәтижелері көрсетілген. Эми болжамдардың қалыпты немесе Гаусс үлестірімі деп те аталатын таныс қоңырау тәрізді қисық бойымен таралғанын көре алады. Қоңырау қисығының шыңымен көрсетілген ең жиі кездесетін болжам — 44%. Эми сонымен қатар компанияның болжау жүйесінің өте шулы екенін көре алады: егер бәрі дәл болса, бірдей болуы тиіс болжамдар едәуір ауқымда ауытқиды.

3-СУРЕТ: GoodSell-дің бір аймақ үшін нарық үлесі болжамдарының үлестірімі
Біз GoodSell болжамдау жүйесіндегі шудың мөлшерін белгілі бір санмен көрсете аламыз. Дәл секундомермен айналымдарды өлшегеніміз сияқты, мұнда да болжамдардың стандартты ауытқуын (деректер жиынтығындағы мәндердің орташа мәннен қаншалықты алшақ екенін көрсететін статистикалық көрсеткіш) есептей аламыз. Аты айтып тұрғандай, стандартты ауытқу орташа мәннен бастапқы типтік қашықтықты білдіреді. Бұл мысалда ол 10 пайыздық пунктке тең. Барлық қалыпты таралу заңдылықтарына сәйкес, болжамдардың шамамен үштен екісі орташа мәннің екі жағындағы бір стандартты ауытқу шеңберіне — бұл мысалда 34% бен 54% нарықтық үлес аралығына — сыяды. Енді Эмидің қолында нарықтық үлес болжамдарындағы жүйелі шудың мөлшері туралы бағалау бар. (Неғұрлым нақтырақ шу аудиті үшін бірнеше болжамдық есептерді қолданған дұрыс болар еді, бірақ біздің мақсатымыз үшін біреуі де жеткілікті. )
2-тараудағы нақты сақтандыру компаниясының басшылары сияқты, Эми де нәтижелерге таңғалып, әрекет еткісі келеді. Шудың жол берілмейтін мөлшері болжамдаушылардың өздерінен талап етілетін процедураларды орындауда тәртіп сақтамайтынын көрсетеді. Эми болжамдаушылардың жұмысында біркелкілік пен тәртіпті орнату үшін шу бойынша кеңесші жалдауға рұқсат сұрайды. Өкінішке орай, ол қолдау таппайды. Оның бастығының жауабы қисынды көрінеді: "Егер біз болжамдарымыздың дұрыс не бұрыс екенін білмесек, қателерді қалай азайтамыз? " — дейді ол. Оның айтуынша, егер болжамдарда үлкен орташа қателік (яғни, үлкен жүйелі ауытқу немесе bias — болжамдардың орташа алғанда бір бағытқа қарай ауытқуы) болса, соны шешу басымдық болуы тиіс. GoodSell болжамдарды жақсарту үшін қандай да бір әрекет жасамас бұрын, олардың дұрыстығын анықтауды күтуі керек деген қорытындыға келеді.
Алғашқы шу аудитінен бір жыл өткен соң, болжамдаушылар болжағысы келген нәтиже белгілі болды. Нысаналы аймақтағы нарық үлесі 34% болып шықты. Енді біз әрбір болжамдаушының қателігін білеміз, бұл жай ғана болжам мен нақты нәтиже арасындағы айырмашылық. 34% болжамы үшін қателік — 0, 44% орташа болжамы үшін — 10%, ал 24% төмен болжамы үшін қателік — -10%.
4-сурет қателіктердің таралуын көрсетеді. Бұл 3-суреттегі болжамдардың таралуымен бірдей, тек әрбір болжамнан нақты мән (34%) шегерілген. Таралу формасы өзгерген жоқ және стандартты ауытқу (біздің шу өлшеміміз) әлі де 10%-ды құрайды.

4-СУРЕТ: GoodSell-дің бір аймаққа арналған болжамдарындағы қателіктердің таралуы
3 және 4-суреттердің айырмашылығы нысанаға атылған оқтардың ізіне алдыңғы және артқы жағынан қараудың айырмашылығына ұқсас (кіріспені қараңыз). Ату кезіндегі шуды байқау үшін нысананың орнын білу қажет емес еді; сол сияқты, нақты нәтижені білу болжамдағы шу туралы бұрыннан белгілі нәрсеге ештеңе қоспайды.
Эми Симкин мен оның бастығы енді бұрын білмеген нәрсені — болжамдардағы жүйелі ауытқудың (bias) мөлшерін біледі. Жүйелі ауытқу — бұл қателіктердің орташа мәні, ол бұл жағдайда 10%-ға тең. Демек, бұл деректер жиынтығында жүйелі ауытқу мен шу сандық тұрғыдан бірдей болып шықты. (Түсінікті болу үшін айта кетейік, шу мен жүйелі ауытқудың бұл теңдігі жалпы ереже емес, бірақ олардың тең болуы олардың рөлін түсінуді жеңілдетеді. ) Болжамдаушылардың көпшілігі оптимистік қателік жасағанын көруге болады — яғни, олар қол жеткізілетін нарық үлесін асыра бағалады: олардың көпшілігі нөлдік қателік жолағының оң жағында қателесті. (Шын мәнінде, қалыпты таралу қасиеттерін пайдалана отырып, біз бұл жағдай болжамдардың 84%-ына қатысты екенін білеміз. )
Эмидің бастығы өз ризашылығын жасырмай, оның айтқаны дұрыс болғанын атап өтті. Болжамдарда жүйелі ауытқу өте көп болды! Шынында да, енді жүйелі ауытқуды азайту жақсы нәтиже беретіні анық. Бірақ Эми әлі де болса: "Осыдан бір жыл бұрын — және қазір де — шуды азайту дұрыс идея болар ма еді? " — деп ойлайды. Мұндай жақсартудың құны жүйелі ауытқуды азайтумен салыстырғанда қандай болар еді?
Орташа квадраттар
Эмидің сұрағына жауап беру үшін бізге қателіктерді "бағалау ережесі" қажет, яғни жеке қателіктерді біріктіріп, жалпы қателіктің бірыңғай өлшеміне айналдыру тәсілі керек. Бақытымызға орай, мұндай құрал бар. Бұл — 1795 жылы 1777 жылы туылған әйгілі математик, жас кезінен-ақ ірі жаңалықтар ашқан данышпан Карл Фридрих Гаусс ойлап тапқан ең кіші квадраттар әдісі.
Гаусс жеке қателіктердің жалпы қателікке қосатын үлесін есептеу ережесін ұсынды. Оның жалпы қателік өлшемі — орташа квадраттық қателік (MSE) деп аталады және ол жеке өлшеу қателіктерінің квадраттарының орташа мәні болып табылады.
Гаустың жалпы қателікті өлшеуге қатысты дәлелдері бұл кітаптың ауқымынан тыс, және оның шешімі бірден түсінікті бола қоймайды. Неліктен қателіктердің квадратын пайдалану керек? Бұл идея ерікті, тіпті оғаш көрінуі мүмкін. Дегенмен, көріп отырғаныңыздай, ол сіз бөлісетін интуицияға негізделген.
Мұның себебін түсіну үшін, мүлдем басқа болып көрінетін, бірақ шын мәнінде дәл сондай мәселеге тоқталайық. Сізге сызғыш беріліп, сызықтың ұзындығын миллиметрге дейінгі дәлдікпен өлшеу тапсырылды делік. Сізге бес рет өлшеуге рұқсат берілген. Олар 5-суреттегі сызықта төмен қараған үшбұрыштармен көрсетілген.

5-СУРЕТ: Бір ұзындықтың бес өлшемі
Көріп отырғаныңыздай, бес өлшем де 971-ден 980 миллиметрге дейінгі аралықта. Сызықтың нақты ұзындығы туралы ең жақсы бағалауыңыз қандай? Мұнда екі негізгі нұсқа бар. Біріншісі — медиана (реттелген сандар қатарының дәл ортасында орналасқан мән), ол екі қысқа және екі ұзын өлшемнің арасында орналасады. Ол — 973 миллиметр. Екінші нұсқа — арифметикалық орташа мән, бұл мысалда 975 миллиметр және ол жоғары қараған көрсеткішпен белгіленген. Сіздің интуицияңыз орташа мәнді таңдауы мүмкін және бұл дұрыс. Орташа мән көбірек ақпаратты қамтиды; оған сандардың мөлшері әсер етеді, ал медианаға тек олардың реті ғана әсер етеді.
Сізге түсінікті осы бағалау мәселесі мен бізді қызықтыратын жалпы қателікті өлшеу мәселесінің арасында тығыз байланыс бар. Олар, шын мәнінде, бір монетаның екі жағы. Себебі ең жақсы бағалау — қолжетімді өлшемдердің жалпы қателігін барынша азайтатын бағалау. Соған сәйкес, егер орташа мән ең жақсы бағалау деген интуицияңыз дұрыс болса, онда сіз жалпы қателікті өлшеу үшін қолданатын формула қателік минималды болатын мән ретінде арифметикалық орташаны беруі керек.
MSE-де дәл осы қасиет бар — және бұл қасиетке ие жалғыз жалпы қателік анықтамасы. 6-суретте біз сызықтың нақты ұзындығының он ықтимал бүтін мәні үшін бес өлшем жиынтығындағы MSE мәнін есептедік. Мысалы, егер нақты мән 971 болса, бес өлшемдегі қателіктер 0, 1, 2, 8 және 9 болар еді. Бұл қателіктердің квадраттарының қосындысы 150-ге, ал орташа мәні 30-ға тең. Бұл — кейбір өлшемдердің нақты мәннен алыс екенін көрсететін үлкен сан. MSE мәні 975-ке (орташа мәнге) жақындаған сайын азайып, сол нүктеден асқан соң қайтадан өсетінін көруге болады. Орташа мән біздің ең жақсы бағалауымыз болып табылады, өйткені ол жалпы қателікті барынша азайтатын мән.

6-СУРЕТ: Нақты ұзындықтың он ықтимал мәні үшін орташа квадраттық қателік (MSE)
Сондай-ақ, сіздің бағалауыңыз орташа мәннен алшақтаған сайын жалпы қателіктің жылдам өсетінін көруге болады. Мысалы, сіздің бағалауыңыз небәрі 3 миллиметрге, 976-дан 979-ға дейін өскенде, MSE екі есе артады. Бұл MSE-нің негізгі ерекшелігі: квадраттау үлкен қателіктерге кішілерге қарағанда әлдеқайда үлкен салмақ береді.
Енді Гаустың жалпы қателікті өлшеу формуласы неліктен орташа квадраттық қателік деп аталатынын және оның бағалау әдісі неліктен ең кіші квадраттар әдісі деп аталатынын түсіндіңіз. Қателіктерді квадраттау — оның орталық идеясы және ешқандай басқа формула "орташа мән — ең жақсы бағалау" деген интуицияңызға сәйкес келмейді.
Гаусс тәсілінің артықшылықтарын басқа математиктер тез мойындады. Гаусс MSE-ді (және басқа да математикалық жаңалықтарды) Еуропаның ең үздік астрономдары шеше алмаған жұмбақты шешу үшін қолданды: 1801 жылы күннің шұғыласына сіңіп жоғалып кетпес бұрын қысқа уақыт бойы ғана бақыланған Церера астероидын қайта табу. Астрономдар Церераның траекториясын бағалауға тырысты, бірақ олардың телескоптарының өлшеу қателігін есепке алу тәсілі қате болды және планета олардың нәтижелері көрсеткен жерде қайта пайда болмады. Гаусс олардың есептеулерін ең кіші квадраттар әдісін қолдана отырып қайта жасады. Астрономдар телескоптарын ол көрсеткен нүктеге бағыттағанда, олар Церераны тапты!
Түрлі саладағы ғалымдар ең кіші квадраттар әдісін тез қабылдады. Екі ғасырдан астам уақыт өтсе де, ол дәлдікке қол жеткізу мақсаты болып табылатын барлық жерде қателіктерді бағалаудың стандартты тәсілі болып қала береді. Қателіктерді олардың квадраты бойынша өлшеу статистика үшін өте маңызды. Барлық ғылыми салалардағы қосымшалардың басым көпшілігінде MSE басымдыққа ие. Көріп отырғанымыздай, бұл тәсілдің күтпеген салдарлары бар.
Қателік теңдеулері
Жүйелі ауытқу мен шудың қателіктегі рөлін біз "қателік теңдеулері" деп атайтын екі өрнекпен оңай қорытындылауға болады. Бұл теңдеулердің біріншісі бір өлшемдегі қателікті сізге бұрыннан таныс екі компонентке жіктейді: жүйелі ауытқу (орташа қателік) және қалдық "шулы қателік". Шулы қателік — қателік жүйелі ауытқудан үлкен болғанда оң, ал кіші болғанда теріс болады. Шулы қателіктердің орташа мәні нөлге тең. Бірінші қателік теңдеуінде жаңа ештеңе жоқ.
Бір өлшемдегі қателік = Жүйелі ауытқу + Шулы қателік
Екінші қателік теңдеуі біз енгізген жалпы қателік өлшемі — MSE-нің жіктелуі болып табылады. Қарапайым алгебраның көмегімен MSE жүйелі ауытқу мен шудың квадраттарының қосындысына тең екенін көрсетуге болады. (Есіңізде болсын, шу — бұл өлшемдердің стандартты ауытқуы, ол шулы қателіктердің стандартты ауытқуымен бірдей. ) Сонымен:
Жалпы қателік (MSE) = Жүйелі ауытқу² + Шу²
Бұл теңдеудің формасы — екі квадраттың қосындысы — сізге мектептегі сүйікті Пифагор теоремасын еске түсіруі мүмкін. Есіңізде болса, тікбұрышты үшбұрышта екі кіші қабырғаның квадраттарының қосындысы ең ұзын қабырғаның (гипотенузаның) квадратына тең. Бұл қателік теңдеуін қарапайым визуализациялауға мүмкіндік береді, мұнда MSE, Жүйелі ауытқу² және Шу² тікбұрышты үшбұрыштың қабырғаларындағы үш шаршының аудандары болып табылады. 7-суретте MSE (күңгірт шаршының ауданы) басқа екі шаршының аудандарының қосындысына қалай тең болатыны көрсетілген. Сол жақ панельде жүйелі ауытқуға қарағанда шу көбірек; оң жақта жүйелі ауытқу шудан көп. Бірақ MSE бірдей және қателік теңдеуі екі жағдайда да орындалады.

7-СУРЕТ: MSE-нің екі жіктелуі
Математикалық өрнек пен оның визуалды бейнесі көрсеткендей, жүйелі ауытқу мен шу қателік теңдеуінде бірдей рөл атқарады. Олар бір-біріне тәуелсіз және жалпы қателікті анықтауда бірдей салмаққа ие. (Кейінгі тарауларда шудың компоненттерін талдағанда да осындай квадраттар қосындысына жіктеуді қолданатынымызды ескеріңіз. )
Қателік теңдеуі Эми көтерген практикалық сұраққа жауап береді: шуды немесе жүйелі ауытқуды бірдей мөлшерге азайту жалпы қателікке қалай әсер етеді? Жауабы айқын: қателік теңдеуінде жүйелі ауытқу мен шу бір-бірін алмастыра алады және қайсысы азайтылғанына қарамастан, жалпы қателіктің кемуі бірдей болады. Жүйелі ауытқу мен шу тең болған 4-суретте (екеуі де 10%), олардың жалпы қателікке қосатын үлесі де тең.
Қателік теңдеуі сондай-ақ Эми Симкиннің шуды азайтуға тырысқан алғашқы талпынысын толықтай қолдайды. Шуды байқаған сайын, оны азайтуға жұмыс істеу керек! Теңдеу Эмидің бастығы "GoodSell болжамдардағы жүйелі ауытқуды өлшегенше күтуі керек" деп айтқанда қателескенін көрсетеді. Жалпы қателік тұрғысынан алғанда, шу мен жүйелі ауытқу тәуелсіз: шуды азайтудың пайдасы жүйелі ауытқудың мөлшеріне қарамастан бірдей.
Бұл ұғым интуицияға қайшы келеді, бірақ өте маңызды. Оны суреттеу үшін 8-суретте жүйелі ауытқу мен шуды бірдей мөлшерге азайтудың әсері көрсетілген. Екі панельде де не нәрсеге қол жеткізілгенін бағалау үшін қателіктердің бастапқы таралуы (4-суреттен) үзік сызықпен көрсетілген.

8-СУРЕТ: Жүйелі ауытқуды екі есе азайту және шуды екі есе азайту кезіндегі қателіктердің таралуы
А панелінде Эмидің бастығының айтқаны болды деп есептейік: ол жүйелі ауытқудың қандай екенін анықтап, оны екі есе азайтудың жолын тапты (бәлкім, тым оптимистік болжамдаушыларға кері байланыс беру арқылы). Шу бойынша ештеңе жасалған жоқ. Жақсарту көрініп тұр: болжамдардың бүкіл таралуы нақты мәнге жақындады.
Б панелінде Эми жеңіп шықса не болатынын көрсетеміз. Жүйелі ауытқу өзгерген жоқ, бірақ шу екі есе азайды. Мұндағы парадокс — шуды азайту жағдайды нашарлатқан сияқты көрінеді. Болжамдар енді көбірек шоғырланған (шу азырақ), бірақ дәлірек емес (жүйелі ауытқу азайған жоқ). Бұрын болжамдардың 84%-ы нақты мәннің бір жағында болса, қазір барлығы дерлік (98%) нақты мәннен асып түсу бағытында қателеседі. Шуды азайту болжамдарды "дәлірек қате" еткен сияқты — бұл Эми күткен жақсарту емес!
Дегенмен, сыртқы көрініске қарамастан, жалпы қателік Б панелінде де А панеліндегідей мөлшерде азайды. Б панеліндегі нашарлау елесі жүйелі ауытқу туралы қате интуициядан туындайды. Жүйелі ауытқудың сәйкес өлшемі — оң және теріс қателіктердің теңсіздігі емес. Ол — қалыпты таралу қисығының шыңы мен нақты мән арасындағы қашықтық болып табылатын орташа қателік. Б панелінде бұл орташа қателік бастапқы жағдайдан өзгерген жоқ — ол әлі де 10%-ға тең, бірақ нашарлаған жоқ. Шынында да, жүйелі ауытқудың болуы енді анық байқалады, өйткені ол жалпы қателіктің үлкен бөлігін құрайды (50% емес, 80%). Бірақ бұл шудың азайғанына байланысты. Керісінше, А панелінде жүйелі ауытқу азайды, бірақ шу азайған жоқ. Түпкілікті нәтиже — екі панельде де MSE бірдей: шуды немесе жүйелі ауытқуды бірдей мөлшерге азайту MSE-ге бірдей әсер етеді.
Бұл мысал көрсеткендей, MSE болжамдық пайымдауларды бағалау туралы жалпы интуициямен қайшы келеді. MSE-ні азайту үшін сіз үлкен қателіктерден аулақ болуға назар аударуыңыз керек. Мысалы, ұзындықты өлшесеңіз, қателікті 11 см-ден 10 см-ге дейін азайтудың әсері, қателікті 1 см-ден 0-ге (дәл тигізуге) дейін азайту әсерінен 21 есе үлкен. Өкінішке орай, бұл мәселеде адамдардың интуициясы болуы керек нәрсенің кері бейнесі сияқты: адамдар нысанаға дәл тигізуге өте құмар және кішкентай қателіктерге өте сезімтал, бірақ олар екі үлкен қателіктің арасындағы айырмашылыққа мүлдем мән бермейді. Сіз өз мақсатыңызды нақты пайымдаулар жасау деп шын ниетпен сенсеңіз де, нәтижелерге эмоционалды реакцияңыз ғылым анықтаған дәлдікке қол жеткізумен үйлеспеуі мүмкін.
Әрине, мұндағы ең жақсы шешім — шуды да, жүйелі ауытқуды да азайту болар еді. Жүйелі ауытқу мен шу тәуелсіз болғандықтан, Эми Симкин мен оның бастығының бірін таңдаудың қажеті жоқ. Осыған байланысты, егер GoodSell шуды азайтуға шешім қабылдаса, шуды азайтудың жүйелі ауытқуды көрінетін (тіпті байқамау мүмкін емес) ету фактісі жақсы нәтиже беруі мүмкін. Шуды азайтуға қол жеткізу жүйелі ауытқуды азайтудың компания күн тәртібіндегі келесі мәселе болуын қамтамасыз етеді.
Жүйелі ауытқу шудан әлдеқайда үлкен болса, шуды азайту басымдығы азырақ болар еді. Бірақ GoodSell мысалы атап өтуге тұрарлық тағы бір сабақ береді. Бұл жеңілдетілген модельде біз шу мен жүйелі ауытқуды тең деп қабылдадық. Қателік теңдеуінің формасын ескерсек, олардың жалпы қателікке қосатын үлесі де тең: жүйелі ауытқу жалпы қателіктің 50%-ын құрайды, шу да 50%-ын құрайды. Дегенмен, атап өткеніміздей, болжамдаушылардың 84%-ы бір бағытта қателеседі. Шумен бірдей әсер ету үшін жүйелі ауытқудың осындай үлкен болуы қажет (жеті адамның алтауы бір бағытта қателеседі! ). Сондықтан біз жүйелі ауытқудан гөрі шу көбірек болатын жағдайларды жиі кездестіретінімізге таңғалмауымыз керек.
Біз қателік теңдеуінің қолданылуын бір жағдайға — GoodSell аумағының бір нақты аймағына қатысты көрсеттік. Әрине, шу аудитін бірден бірнеше жағдай бойынша жүргізу әрқашан дұрыс. Ештеңе өзгермейді. Қателік теңдеуі жеке жағдайларға қолданылады; ал жалпы теңдеу жағдайлар бойынша MSE, жүйелі ауытқудың квадраты және шудың квадратының орташа мәндерін алу арқылы шығарылады. Эми Симкин үшін бір немесе әртүрлі болжамдаушылардан бірнеше аймақ бойынша бірнеше болжам алу жақсырақ болар еді. Нәтижелерді орташаландыру оған GoodSell болжамдау жүйесіндегі жүйелі ауытқу мен шудың нақтырақ көрінісін берер еді.
Шудың құны
Қателік теңдеуі — бұл кітаптың интеллектуалды негізі. Ол болжамдық пайымдаулардағы жүйелі шуды азайту мақсатының негіздемесін береді, бұл мақсат негізінен статистикалық жүйелі ауытқуды азайтумен бірдей маңызды. (Статистикалық жүйелі ауытқу — әлеуметтік кемсітушіліктің синонимі емес; бұл жай ғана пайымдаулар жиынтығындағы орташа қателік екенін ескеруіміз керек. )
Қателік теңдеуі және біз жасаған қорытындылар жалпы қателік өлшемі ретінде MSE-ді қолдануға негізделген. Бұл ереже таза болжамдық пайымдауларға, соның ішінде максималды дәлдікке (ең аз жүйелі ауытқу) және анықтыққа (ең аз шу) қол жеткізуді мақсат ететін болжамдар мен бағалауларға жарамды.
Дегенмен, қателік теңдеуі бағалаушы пайымдауларға (құндылықтарға, талғамға немесе нормаларға негізделген шешімдер) қолданылмайды, өйткені нақты ақиқат мәнге байланысты болатын "қателік" ұғымын бұл жерде қолдану әлдеқайда қиын. Сонымен қатар, қателіктер анықталса да, олардың құны сирек симметриялы болады және олардың квадратына дәл пропорционал болуы екіталай.
Мысалы, лифт шығаратын компания үшін лифттің максималды жүктемесін бағалаудағы қателіктердің салдары анық асимметриялы: аз бағалау шығынға әкеледі, бірақ артық бағалау апатты болуы мүмкін. Квадраттық қателік пойызға үлгеру үшін үйден қашан шығу керектігі туралы шешімге де қатысты емес. Бұл шешім үшін бір минутқа кешігудің немесе бес минутқа кешігудің салдары бірдей. Ал 2-тараудағы сақтандыру компаниясы полистердің бағасын белгілегенде немесе талаптардың құнын бағалағанда, екі бағыттағы қателіктер де шығын әкеледі, бірақ олардың шығындары баламалы деп санауға негіз жоқ.
Бұл мысалдар шешім қабылдаудағы болжамдық және бағалаушы пайымдаулардың рөлін нақтылау қажеттілігін көрсетеді. Жақсы шешім қабылдаудың кең таралған қағидасы — құндылықтарыңыз бен фактілеріңізді араластырмау керек. Жақсы шешім қабылдау үміттер мен қорқыныштардан немесе талғамдар мен құндылықтардан мүлдем әсер алмайтын объективті және дәл болжамдық пайымдауларға негізделуі тиіс. Лифт компаниясы үшін бірінші қадам әртүрлі инженерлік шешімдер кезінде лифттің максималды техникалық жүктемесін бейтарап есептеу болар еді. Қауіпсіздік тек екінші қадамда, бағалаушы пайымдау максималды сыйымдылықты орнату үшін қолайлы қауіпсіздік шегін анықтаған кезде басты мәселеге айналады. (Әрине, бұл таңдау фактілерге негізделген пайымдауларға, мысалы, сол қауіпсіздік шегінің шығындары мен пайдасына да байланысты болады. ) Сол сияқты, вокзалға қашан шығу керектігін шешудің бірінші қадамы әртүрлі жол жүру уақыттарының ықтималдықтарын объективті түрде анықтау болуы керек. Пойыздан қалып қою және вокзалда уақытты босқа өткізудің тиісті шығындары сіз қабылдағыңыз келетін тәуекелді таңдаған кезде ғана маңызды болады.
Осы логика әлдеқайда маңызды шешімдерге де қатысты. Әскери қолбасшы шабуыл бастау туралы шешім қабылдағанда көптеген жайттарды ескеруі керек, бірақ ол сенетін барлау мәліметтерінің көбі болжамдық пайымдау мәселесі болып табылады. Пандемия сияқты денсаулық сақтау дағдарысына жауап беретін үкімет түрлі нұсқалардың оң және теріс жақтарын саралауы тиіс, бірақ әрбір нұсқаның (соның ішінде ештеңе істемеу шешімінің) ықтимал салдары туралы дәл болжамдарсыз ешқандай бағалау мүмкін емес.
Барлық осы мысалдарда соңғы шешімдер бағалау пайымдауларын талап етеді. Шешім қабылдаушылар бірнеше нұсқаны қарастырып, оңтайлы таңдау жасау үшін өз құндылықтарын қолдануы керек. Бірақ шешімдер құндылықтардан бейтарап болуы тиіс негізгі болжамдарға тәуелді. Олардың мақсаты — дәлдік, яғни нысананың дәл ортасына — bull’s-eye — барынша жақын тию, ал MSE (Орташа квадраттық қате — болжамдық қателерді есептеу әдісі) — қатенің тиісті өлшемі. Болжамдық пайымдаулар, егер олар ойысуды үлкен дәрежеде арттырмаса, шуды азайтатын процедуралар арқылы жақсарады.
Қате теңдеуі туралы айтатын болсақ
«Қызығы, ойысу мен шуды бірдей мөлшерге азайту дәлдікке бірдей әсер етеді. »
«Болжамдық пайымдаудағы шуды азайту, ойысу туралы не білетініңізге қарамастан, әрқашан пайдалы. »
«Пайымдаулар шынайы мәннен жоғары және төмен болып 84-ке 16 қатынасында бөлінгенде, үлкен ойысу болады — бұл ойысу мен шу тең болған кез. »
«Болжамдық пайымдаулар әрбір шешімге қатысады және дәлдік олардың жалғыз мақсаты болуы керек. Құндылықтарыңыз бен фактілеріңізді бөлек ұстаңыз. »
6-ТАРАУ
Шуды талдау
Алдыңғы тарауда бір жағдайды өлшеудегі немесе бағалаудағы өзгермелілік талқыланды. Біз бір жағдайға назар аударғанда, пайымдаудың барлық өзгермелілігі қате болып табылады, ал қатенің екі құрамдас бөлігі — ойысу мен шу. Әрине, біз зерттеп жатқан пайымдау жүйелері, соның ішінде соттар мен сақтандыру компаниялары, әртүрлі жағдайлармен жұмыс істеуге және оларды ажыратуға арналған. Егер федералды судьялар мен шағымдарды реттеушілер өздеріне келетін барлық істер бойынша бірдей шешім шығарса, олардың пайдасы аз болар еді. Түрлі істер бойынша пайымдаулардағы өзгермеліліктің көп бөлігі әдейі жасалады.
Дегенмен, бір іс бойынша пайымдаулардағы өзгермелілік әлі де қалаусыз — бұл жүйелік шу. Біз көрсететініміздей, бір адамдар бірнеше іс бойынша пайымдау жасайтын шу аудиті жүйелік шуды егжей-тегжейлі талдауға мүмкіндік береді.
Сот үкімдеріне жүргізілген шу аудиті
Бірнеше істер арқылы шуды талдауды суреттеу үшін біз федералды судьялардың сот үкімдерін шығаруына қатысты ерекше егжей-тегжейлі шу аудитіне жүгінеміз. Талдау 1981 жылы бірінші тарауда сипатталған сот үкімдерін реформалау қозғалысының бөлігі ретінде жарияланды. Зерттеу тек сот үкімдеріне қатысты шешімдерге бағытталған, бірақ ол ұсынатын сабақтар жалпы сипатқа ие және басқа да кәсіби пайымдауларға қатысты. Шу аудитінің мақсаты — судья Френкель және басқалар жинаған шудың жарқын, бірақ эпизодтық айғақтарынан асып түсіп, «үкімдердегі сәйкессіздік дәрежесін» неғұрлым жүйелі түрде анықтау болды.
Зерттеу авторлары айыпталушы кінәлі деп танылып, үкім кесілуі тиіс он алты гипотетикалық істі әзірледі. Виньеткаларда (қысқа сипаттамаларда) қарақшылық немесе алаяқтық істері бейнеленген және олар алты басқа өлшем бойынша ерекшеленді, соның ішінде айыпталушы қылмыстың негізгі орындаушысы ма, әлде сыбайласы ма, оның соттылығы бар ма, (қарақшылық істері үшін) қару қолданылды ма және т. б.
Зерттеушілер 208 белсенді федералды судьядан тұратын ұлттық іріктеумен мұқият құрылымдалған сұхбаттар ұйымдастырды. Тоқсан минут ішінде судьяларға барлық он алты іс ұсынылып, үкім тағайындау сұралды.
Бұл зерттеуден не үйренуге болатынын түсіну үшін сізге визуализация жаттығуы пайдалы болады. Қылмыстар үшін А-дан Р-ға дейін белгіленген 16 бағаны және судьялар үшін 1-ден 208-ге дейін белгіленген 208 жолы бар үлкен кестені елестетіңіз. А1-ден Р208-ге дейінгі әрбір ұяшық нақты судьяның нақты іс бойынша тағайындаған түрме мерзімін көрсетеді. 9-суретте осы 3328 ұяшықты кестенің қандай болатыны көрсетілген. Шуды зерттеу үшін біз әрқайсысы жеке шу аудиті болып табылатын он алты бағанға назар аударғымыз келеді.

9-СУРЕТ: Сот үкімдерін зерттеудің көрінісі
Орташа үкімдер
Нақты бір іс бойынша үкімнің «шынайы мәні» қандай екенін анықтаудың объективті жолы жоқ. Төменде біз әр іс бойынша 208 үкімнің орташа мәнін (орташа үкім) сол іс үшін «әділ» үкім ретінде қарастырамыз. 1-тарауда атап өткеніміздей, АҚШ-тың Сот үкімдерін шығару жөніндегі комиссиясы өткен істердегі орташа тәжірибені үкім шығару нұсқаулықтарын бекітудің негізі ретінде пайдаланғанда дәл осындай болжам жасады. Бұл белгі әр іс бойынша орташа пайымдауда нөлдік ойысу бар деп есептейді.
Біз іс жүзінде бұл болжамның қате екенін толық түсінеміз: кейбір істер бойынша орташа пайымдау басқа, өте ұқсас істер бойынша орташа пайымдаумен салыстырғанда, мысалы, нәсілдік кемсітушілікке байланысты бұрмаланған болуы әбден мүмкін. Істер бойынша ойысулардың дисперсиясы — кейбірі оң, кейбірі теріс — қателік пен әділетсіздіктің маңызды көзі болып табылады. Бір қызығы, бұл дисперсия жиі «ойысу» деп аталады. Біздің осы тараудағы және осы кітаптағы талдауымыз қателіктің ерекше көзі болып табылатын шуға бағытталған. Судья Френкель шудың әділетсіздігін баса айтты, бірақ ойысуға да (соның ішінде нәсілдік кемсітушілікке) назар аудартты. Сол сияқты, біздің шуға назар аударуымыз ортақ ойысуларды өлшеу мен олармен күресудің маңыздылығын төмендетпеуі тиіс.
Ыңғайлы болу үшін әр іс бойынша орташа үкім кестенің төменгі жолында көрсетілген. Істер қатаңдықтың арту ретімен орналасқан: А ісіндегі орташа үкім — 1 жыл; Р ісінде — 15,3 жыл. Барлық он алты іс бойынша орташа түрме мерзімі — 7 жыл.
Енді барлық судьялар әділдіктің мінсіз өлшеу құралдары болып табылатын және сот үкімдерін шығаруда шу жоқ мінсіз әлемді елестетіңіз. Мұндай әлемде 9-сурет қандай болар еді? Көрініп тұрғандай, А ісі бағанындағы барлық ұяшықтар бірдей болар еді, өйткені барлық судьялар А ісіндегі айыпталушыға тура бір жылдық бірдей үкім берер еді. Басқа барлық бағандарда да солай болар еді. Әр жолдағы сандар, әрине, әлі де өзгерер еді, өйткені істер әртүрлі. Бірақ әрбір жол өзінің үстіндегі және астындағы жолдармен бірдей болар еді. Істер арасындағы айырмашылықтар кестедегі өзгермеліліктің жалғыз көзі болар еді.
Өкінішке орай, федералдық әділет әлемі мінсіз емес. Судьялар бірдей емес және бағандар ішіндегі өзгермелілік үлкен, бұл әр іс бойынша пайымдаулардағы шуды көрсетеді. Үкімдерде болуы тиіс мөлшерден көп өзгермелілік бар және зерттеудің мақсаты — оны талдау.
Сот үкімі лотереясы
Жоғарыда сипатталған, барлық істер әр судьядан бірдей жаза алатын мінсіз әлем суретінен бастаңыз. Әрбір баған — 208 бірдей сандардың тізбегі. Енді әр баған бойынша төмен түсіп, кейбір сандарды анда-санда өзгерту арқылы шу қосыңыз — кейде орташа үкімге түрме мерзімін қосып, кейде одан алып тастаңыз. Сіз жасаған өзгерістердің бәрі бірдей болмағандықтан, олар баған ішінде өзгермелілік тудырады. Бұл өзгермелілік — шу.
Бұл зерттеудің негізгі нәтижесі — әрбір іс бойынша пайымдауларда байқалған шудың үлкен мөлшері. Әрбір іс ішіндегі шудың өлшемі — сол іс бойынша тағайындалған түрме мерзімдерінің стандартты ауытқуы (деректердің орташа мәннен қаншалықты таралғанын көрсететін өлшем). Орташа іс үшін орташа үкім 7,0 жыл болса, сол орташа мән айналасындағы стандартты ауытқу 3,4 жыл болды.
Сіз «стандартты ауытқу» терминімен таныс болсаңыз да, нақты сипаттаманы пайдалы деп табуыңыз мүмкін. Екі судьяны кездейсоқ таңдап, олардың бір іс бойынша пайымдауларының айырмашылығын есептегеніңізді елестетіңіз. Енді мұны барлық судьялар жұптары мен барлық істер үшін қайталап, нәтижелерді орташалаңыз. Бұл өлшем, орташа абсолюттік айырмашылық , федералдық сот залында айыпталушы бетпе-бет келетін лотерея сезімін беруі тиіс. Пайымдаулар қалыпты таралған деп есептесек, ол стандартты ауытқудан 1,128 есе көп болады, бұл бір іс бойынша кездейсоқ таңдалған екі үкімнің арасындағы орташа айырмашылық 3,8 жыл болатынын білдіреді. 3-тарауда біз сақтандыру компаниясынан мамандандырылған андеррайтингті қажет ететін клиент алдында тұрған лотерея туралы айттық. Қылмыстық айыпталушының лотереясы, жұмсартып айтқанда, әлдеқайда маңызды салдарға ие.
Орташа үкім 7,0 жыл болғанда судьялар арасындағы 3,8 жылдық орташа абсолюттік айырмашылық — алаңдатарлық және біздің ойымызша, қабылданбайтын нәтиже. Дегенмен, әділеттіліктің нақты іс жүзіндегі әкімшілендіруінде шудың бұдан да көп екеніне күмәндануға негізді себептер бар. Біріншіден, шу аудитіне қатысушылар жасанды істермен жұмыс істеді, оларды салыстыру ерекше оңай болды және олар бірінен соң бірі ұсынылды. Шынайы өмір жүйелілікті сақтау үшін мұншалықты қолдау көрсетпейді. Екіншіден, сот залындағы судьяларда мұндағыдан әлдеқайда көп ақпарат болады. Жаңа ақпарат, егер ол шешуші болмаса, судьялардың бір-бірінен ерекшеленуіне көбірек мүмкіндік береді. Осы себептерге байланысты біз нақты сот залдарында айыпталушылар кезігетін шудың мөлшері мұнда көргенімізден де көп деп күдіктенеміз.
Кейбір судьялар қатал: Деңгейлік шу
Талдаудың келесі кезеңінде авторлар шуды жеке құрамдас бөліктерге бөлді. Сіздің ойыңызға келген шудың бірінші интерпретациясы — судья Френкельдің де ойына келгендей — шу судьялардың қатал үкімдер шығаруға бейімділігінің әртүрлілігіне байланысты. Кез келген қорғаушы айтатындай, судьялардың беделі болады: кейбірі орташа судьядан қатал «жазалаушы судьялар» (hanging judges), ал басқалары орташа судьядан жұмсақ «мейірімді судьялар» (bleeding-heart judges) ретінде танымал. Біз бұл ауытқуларды деңгейлік қателер деп атаймыз. (Тағы да: қате мұнда орташа мәннен ауытқу ретінде анықталады; егер орташа судья қателессе, қате іс жүзінде әділетсіздікті түзеуі мүмкін. )
Деңгейлік қателердегі өзгермелілік кез келген пайымдау тапсырмасында кездеседі. Мысал ретінде кейбір жетекшілер басқаларына қарағанда жомарт болатын жұмыс өнімділігін бағалауды, кейбір болжаушылар басқаларына қарағанда оптимистік болатын нарық үлесін болжауды немесе кейбір ортопедтер басқаларына қарағанда агрессивті болатын омыртқа отасына ұсыныстарды айтуға болады.
9-суреттегі әрбір жол бір судья тағайындаған үкімдерді көрсетеді. Кестенің ең оң жақ бағанында көрсетілген әрбір судья тағайындаған орташа үкім — судьяның қаталдық деңгейінің өлшемі. Белгілі болғандай, судьялар бұл өлшем бойынша айтарлықтай ерекшеленеді. Ең оң жақ бағандағы мәндердің стандартты ауытқуы 2,4 жыл болды. Бұл өзгермеліліктің әділдікке ешқандай қатысы жоқ. Керісінше, сіз күдіктенгеніңіздей, орташа үкімдердегі айырмашылықтар судьялардың басқа сипаттамаларының — олардың өткен жолының, өмірлік тәжірибесінің, саяси көзқарастарының, ойысуларының және т. б. — өзгермелілігін көрсетеді. Зерттеушілер судьялардың жалпы үкім шығаруға деген көзқарастарын тексерді — мысалы, олар үкім шығарудың негізгі мақсаты қабілетсіз ету (қылмыскерді қоғамнан оқшаулау), оңалту немесе тежеу деп санай ма. Олар оңалтуды негізгі мақсат деп санайтын судьялардың тежеуді немесе қабілетсіз етуді нұсқайтын судьяларға қарағанда қысқарақ түрме мерзімдерін және көбірек бақылау мерзімін тағайындауға бейім екенін анықтады. Бөлек қарастырғанда, Американың Оңтүстігінде орналасқан судьялар елдің басқа бөліктеріндегі әріптестеріне қарағанда айтарлықтай ұзағырақ үкімдер тағайындаған. Таңқаларлық емес, консервативті идеология да үкімдердің қаталдығымен байланысты болды.
Жалпы қорытынды — үкім шығарудың орташа деңгейі тұлғалық қасиет сияқты жұмыс істейді. Сіз бұл зерттеуді судьяларды өте қаталдан өте жұмсаққа дейінгі шкала бойынша орналастыру үшін пайдалана аласыз, дәл тұлғалық тест олардың экстраверсия немесе келісімділік дәрежесін өлшейтіндей. Басқа қасиеттер сияқты, біз үкім шығарудың қаталдығы генетикалық факторлармен, өмірлік тәжірибемен және тұлғаның басқа қырларымен байланысты болады деп күтеміз. Олардың ешқайсысының іске немесе айыпталушыға қатысы жоқ. Біз судьялардың орташа пайымдауларының өзгермелілігі үшін деңгейлік шу (түрлі бағалаушылардың жалпы қаталдық немесе жұмсақтық деңгейінің айырмашылығынан туындайтын шу) терминін қолданамыз, ол деңгейлік қателердің өзгермелілігімен бірдей.
Судьялардың айырмашылығы: Үлгілік шу
9-суреттегі қара көрсеткіштер көрсеткендей, деңгейлік шу 2,4 жылды, ал жүйелік шу 3,4 жылды құрайды. Бұл айырмашылық жүйелік шудың жекелеген судьялардың орташа қаталдығындағы айырмашылықтардан да көп екенін көрсетеді. Біз шудың бұл басқа құрамдас бөлігін үлгілік шу (бағалаушының нақты бір жағдайларға немесе сипаттамаларға өзіндік ерекше реакциясынан туындайтын шу) деп атаймыз.
Үлгілік шуды түсіну үшін 9-суретті қайта қарастырып, кездейсоқ таңдалған бір ұяшыққа — айталық, С3 ұяшығына назар аударыңыз. С ісіндегі орташа үкім бағанның төменгі жағында көрсетілген; көріп тұрғаныңыздай, ол 3,7 жыл. Енді 3-судьяның барлық істер бойынша берген орташа үкімін табу үшін ең оң жақ бағанға қараңыз. Ол 5,0 жыл, бұл жалпы орташа мәннен небәрі 2,0 жылға аз. Егер судьялардың қаталдығындағы өзгеріс 3-бағандағы шудың жалғыз көзі болса, сіз С3 ұяшығындағы үкім 3,7 − 2,0 = 1,7 жыл болады деп болжар едіңіз. Бірақ С3 ұяшығындағы нақты жазба — 4 жыл, бұл 3-судьяның сол іс бойынша үкім шығаруда ерекше қатал болғанын көрсетеді.
Дәл осындай қарапайым, аддитивті логика кестенің әрбір бағанындағы әрбір үкімді болжауға мүмкіндік берер еді, бірақ іс жүзінде сіз ұяшықтардың көбінде қарапайым модельден ауытқуларды табар едіңіз. Жол бойынша қарағанда, судьялардың барлық істер бойынша үкім шығаруда бірдей қатал емес екенін байқайсыз: олар кейбірінде өздерінің жеке орташа көрсеткішінен қаталдау, ал басқаларында жұмсақтау болады. Біз бұл қалдық ауытқуларды үлгілік қателер деп атаймыз. Егер сіз осы үлгілік қателерді кестенің әрбір ұяшығына жазып шықсаңыз, олардың әрбір судья (жол) үшін және әрбір іс (баған) үшін қосындысы нөлге тең болатынын табар едіңіз. Дегенмен, үлгілік қателер шуға қосатын үлесі жағынан бір-бірін жоймайды, өйткені шуды есептеу үшін барлық ұяшықтардағы мәндер квадратталады.
Сот үкімдерінің қарапайым аддитивті моделінің дұрыс еместігін растаудың оңай жолы бар. Кестеде әр бағанның төменгі жағындағы орташа үкімдер солдан оңға қарай тұрақты түрде өсетінін көре аласыз, бірақ жолдар ішінде бұл олай емес. Мысалы, 208-судья О ісіндегі айыпталушыға Р ісіндегі айыпталушыға қарағанда әлдеқайда жоғары үкім тағайындады. Егер жекелеген судьялар істерді өздері орынды деп санаған түрме мерзімі бойынша реттесе, олардың рейтингтері бірдей болмас еді.
Біз жаңа ғана анықтаған өзгермелілік үшін «үлгілік шу» терминін қолданамыз, өйткені бұл өзгермелілік судьялардың нақты істерге деген көзқарастарындағы күрделі үлгіні көрсетеді. Мысалы, бір судья жалпы алғанда орташадан қатал болуы мүмкін, бірақ экономикалық қылмыскерлерге (white-collar criminals) қатысты салыстырмалы түрде жұмсақтау болуы мүмкін. Тағы бірі жеңіл жазалауға бейім болуы мүмкін, бірақ құқық бұзушы рецидивист болғанда қаталырақ болады. Үшіншісі орташа қаталдыққа жақын болуы мүмкін, бірақ құқық бұзушы жай ғана сыбайлас болғанда жанашырлық танытып, ал жәбірленуші егде жастағы адам болғанда қаталдық танытуы мүмкін. (Біз оқылымдылық үшін «үлгілік шу» терминін қолданамыз. Үлгілік шудың тиісті статистикалық термині — судья мен істің өзара әрекеттесуі (судьяның белгілі бір іс түрлеріне немесе қылмыскер сипаттарына жеке көзқарасы мен реакциясы). )
Қылмыстық сот төрелігі контексінде істерге қатысты кейбір жеке реакциялар судьяның үкім шығарудағы жеке философиясын көрсетуі мүмкін. Басқа жауаптар судьяның өзі әрең сезінетін ассоциациялардан туындауы мүмкін, мысалы, оған ерекше жеккөрінішті қылмыскерді еске түсіретін немесе бәлкім қызына ұқсайтын айыпталушы. Шығу тегі қандай болса да, бұл үлгілер жай ғана кездейсоқтық емес: егер судья сол істі қайта көрсе, олар қайталанады деп күтеміз. Бірақ үлгілік шу іс жүзінде болжау қиын болғандықтан, ол сот үкімдерінің онсыз да болжап болмайтын лотереясына белгісіздік қосады. Зерттеу авторлары атап өткендей, «қылмыс/қылмыскер сипаттамаларының ықпалындағы судьялар арасындағы үлгілік айырмашылықтар» — «үкімдердегі сәйкессіздіктің қосымша түрі».
Сіз жүйелік шуды деңгейлік шу мен үлгілік шуға бөлу алдыңғы тараудағы қатені ойысу мен шуға бөлген қате теңдеуімен бірдей логикаға негізделгенін байқаған боларсыз. Бұл жолы теңдеуді келесідей жазуға болады:
Жүйелік шу² = Деңгейлік шу² + Үлгілік шу²
Бұл өрнекті бастапқы Қате теңдеуі сияқты көрнекі түрде ұсынуға болады (10-сурет). Біз үшбұрыштың екі қабырғасын тең етіп көрсеттік. Себебі, сот үкімдерін зерттеуде үлгілік шу мен деңгейлік шу жүйелік шуға шамамен бірдей үлес қосады.
Үлгілік шу барлық жерде кездеседі. Дәрігерлер адамдарды ауруханаға жатқызу-жатқызбауды шешіп жатыр, компаниялар кімді жұмысқа алуды шешіп жатыр, заңгерлер қай істерді қозғауды шешіп жатыр немесе Голливуд басшылары қай телешоуларды шығаруды шешіп жатыр делік. Барлық осы жағдайларда әртүрлі бағалаушылар істердің әртүрлі рейтингтерін шығаратын үлгілік шу болады.

10-СУРЕТ: Жүйелік шуды бөлу
Шудың құрамдас бөліктері
Біздің үлгілік шуды қарастыруымыз маңызды бір күрделілікті елеусіз қалдырды: кездейсоқ қатенің ықтимал үлесі.
Секундомер жаттығуын еске түсіріңіз. Сіз он секундты қайталап өлшеуге тырысқанда, нәтижелеріңіз бір айналымнан екіншісіне өзгеріп отырды; сіз адам ішіндегі өзгермелілікті көрсеттіңіз. Сол сияқты, егер судьялардан басқа уақытта қайта сұралса, олар он алты іс бойынша дәл сол үкімдерді тағайындамас еді. Шынында да, кейінірек көретініміздей, егер бастапқы зерттеу сол аптаның басқа күнінде жүргізілсе, олар бірдей үкімдерді бермес еді. Егер судьяның қызына жақсы бірдеңе болғаны үшін немесе кеше сүйікті спорт командасы жеңгені үшін немесе күн ашық болғандықтан көңіл-күйі жақсы болса, оның үкімі басқа жағдайдағыдан жұмсақтау болуы мүмкін. Бұл адам ішіндегі өзгермелілік біз жаңа ғана талқылаған тұрақты тұлғааралық айырмашылықтардан тұжырымдамалық тұрғыдан ерекшеленеді — бірақ бұл өзгермелілік көздерін бір-бірінен ажырату қиын. Біз өтпелі әсерлерге байланысты өзгермелілік үшін сәттік шу (бір адамның түрлі уақытта немесе көңіл-күйге байланысты әртүрлі шешім қабылдауынан болатын шу) терминін қолданамыз.
Біз бұл зерттеуде сәттік шуды іс жүзінде елемедік және шу аудитіндегі судьялардың үкім шығарудағы ерекше үлгілерін тұрақты көзқарастарды білдіреді деп түсіндіруді таңдадық. Бұл болжам, әрине, оптимистік, бірақ бұл зерттеуде сәттік шу үлкен рөл атқармады деп сенуге тәуелсіз себептер бар. Оған қатысқан өте тәжірибелі судьялар өздерімен бірге құқық бұзушылықтар мен айыпталушылардың түрлі белгілерінің маңыздылығы туралы қалыптасқан идеялар жиынтығын әкелгені сөзсіз. Келесі тарауда біз сәттік шуды егжей-тегжейлі талқылаймыз және оны үлгілік шудың тұрақты құрамдас бөлігінен қалай бөлуге болатынын көрсетеміз.
Қорытындылай келе, біз шудың бірнеше түрін талқыладық. Жүйелік шу — бірнеше адамның бір іс бойынша пайымдауларындағы қалаусыз өзгермелілік. Біз оның екі негізгі құрамдас бөлігін анықтадық, оларды бір адамдар бірнеше істі бағалағанда ажыратуға болады:

Деңгейлік шу — әртүрлі судьялардың пайымдауларының орташа деңгейіндегі өзгермелілік.

Үлгілік шу — судьялардың нақты істерге беретін жауаптарындағы өзгермелілік.
Осы зерттеуде деңгейлік шу мен үлгілік шудың мөлшері шамамен тең болды. Дегенмен, біз үлгілік шу деп анықтаған құрамдас бөлікте, әрине, кездейсоқ қате ретінде қарастырылатын кейбір сәттік шу бар.
Біз сот жүйесіндегі шу аудитін мысал ретінде пайдаландық, бірақ дәл осындай талдау кез келген шу аудитіне — бизнесте, медицинада, үкіметте немесе басқа жерде қолданыла алады. Деңгейлік шу да, үлгілік шу да (ол сәттік шуды қамтиды) жүйелік шуға үлес қосады және біз алға жылжыған сайын олармен қайта-қайта кездесетін боламыз.
Шуды талдау туралы айтатын болсақ
“Деңгейлік шу — бұл судьялардың қаталдық деңгейлерінің әртүрлі болуы. Паттерндік шу — бұл олардың қай сотталушыға қатал, қайсысына жеңіл жаза беру керектігі туралы өзара келіспеушілігі. Ал паттерндік шудың бір бөлігі — жағдайлық шу (бір сарапшының бір мәселе бойынша әртүрлі уақытта әртүрлі шешім қабылдауы), яғни судьялардың өз-өзімен келіспеуі. ”
“Кемел дүниеде сотталушылар әділдікпен бетпе-бет келер еді; біздің дүниемізде олар шулы жүйеге тап болады. ”
7-ТАРАУ
Жағдайлық шу
Кәсіби баскетболшы еркін лақтыруға дайындалып жатыр. Ол айып сызығында тұр. Ол зейін қойып, допты лақтырады. Бұл — ол сансыз рет жаттықтырған қимылдардың нақты тізбегі. Ол себетке түсе ме?
Біз білмейміз, ол да білмейді. Ұлттық баскетбол қауымдастығында (NBA) ойыншылар әдетте өз әрекеттерінің төрттен үшін орындайды. Кейбір ойыншылар, әрине, басқаларға қарағанда жақсырақ, бірақ ешбір ойыншы 100% нәтиже көрсетпейді. Барлық уақыттың ең үздік шеберлері еркін лақтырудың 90%-дан сәл астамын орындайды. (Осы жолдар жазылып жатқан кезде, олар — Стефен «Стеф» Карри, Стив Нэш және Марк Прайс. ) Барлық уақыттағы ең нашар көрсеткіштер 50% шамасында. (Мысалы, ұлы Шакил О’Нил өз соққыларының шамамен 53%-ын ғана орындаған. ) Себет әрқашан дәл он фут биіктікте және он бес фут қашықтықта болса да, ал доптың салмағы әрқашан жиырма екі унция болса да, ұпай жинауға қажетті қимылдардың нақты тізбегін қайталау оңай емес. Өзгермелілік тек ойыншылар арасында ғана емес, бір ойыншының ішінде де күтіледі. Еркін лақтыру — бұл лотереяның бір түрі, егер лақтырушы Карри болса, О’Нилге қарағанда сәттілік мүмкіндігі әлдеқайда жоғары, бірақ бұл бәрібір лотерея болып қала береді.
Бұл өзгермелілік қайдан пайда болады? Айып сызығында тұрған ойыншыға сансыз факторлар әсер ететінін білеміз: ұзақ ойыннан қажу, есеп тығыз болғандағы психикалық қысым, өз алаңындағы жанкүйерлердің қолдауы немесе қарсылас команда жанкүйерлерінің ысқырығы. Егер Карри немесе Нэш сияқты біреу мүлт кетсе, біз осы түсіндірмелердің бірін алға тартамыз. Бірақ, шын мәнінде, бұл факторлардың нақты қандай рөл атқаратынын білуіміз екіталай. Лақтырушының нәтижесіндегі өзгермелілік — шудың бір түрі.
Екінші лотерея
Еркін лақтырудағы немесе басқа физикалық процестердегі өзгермелілік таңқаларлық емес. Біз денеміздің өзгермелілігіне үйренгенбіз: жүрек соғысы, қан қысымы, рефлекстер, дауыс ырғағы және қолдың дірілі әртүрлі уақытта әртүрлі болады. Және біз бірдей қолтаңба қалдыруға қанша тырыссақ та, ол әрбір чекте бәрібір сәл өзгеше болады.
Ойымыздың өзгермелілігін бақылау оңай емес. Әрине, бәрімізде жаңа ақпаратсыз-ақ ойымызды өзгерткен кездер болды. Кеше түнде бізді күлкіге қарық қылған фильм енді орташа және есте қалмайтын болып көрінеді. Кеше біз қатал бағалаған адам енді кешірімге лайық сияқты көрінеді. Бұрын бізге ұнамаған немесе түсініксіз болған уәж енді маңызды болып көрінеді. Бірақ бұл мысалдар көрсеткендей, біз әдетте мұндай өзгерістерді салыстырмалы түрде шағын және негізінен субъективті мәселелермен байланыстырамыз.
Шын мәнінде, біздің пікіріміз ешбір айқын себепсіз өзгереді. Бұл жайт кәсіби сарапшылардың мұқият, салмақты шешімдеріне де қатысты. Мысалы, бір дәрігерге бір жағдайды екі рет көрсеткенде, одан айтарлықтай өзгеше диагноздар алу жиі кездеседі (22-тарауды қараңыз). АҚШ-тағы ірі шарап байқауында шарап сарапшылары бір шарапты екі рет дәмін татқанда, олар шараптардың тек 18%-ын ғана бірдей бағалаған (әдетте, ең нашарларын). Криминалист сарапшы бірдей саусақ іздерін бірнеше апта аралығымен екі рет тексергенде әртүрлі қорытындыға келуі мүмкін (20-тарауды қараңыз). Тәжірибелі бағдарламалық қамтамасыз ету кеңесшілері бір тапсырманы орындау уақыты туралы екі бөлек жағдайда айтарлықтай өзгеше бағалаулар бере алады. Қарапайым тілмен айтқанда, допты ешқашан екі рет бірдей лақтырмайтын баскетболшы сияқты, біз де бірдей фактілермен екі рет бетпе-бет келгенде әрқашан бірдей шешім шығармаймыз.
Біз андеррайтерді (тәуекелдерді бағалап, сақтандыру туралы шешім қабылдайтын маман), судьяны немесе дәрігерді таңдау процесін жүйелік шуды тудыратын лотерея ретінде сипаттадық. Жағдайлық шу — екінші лотереяның жемісі. Бұл лотерея маманның шешім қабылдайтын сәтін, маманның көңіл-күйін, жадында жаңа сақталған істер тізбегін және жағдайдың басқа да сансыз ерекшеліктерін таңдайды. Бұл екінші лотерея әдетте біріншісіне қарағанда әлдеқайда дерексіз болып қалады. Біз бірінші лотереяның қалай басқа андеррайтерді таңдауы мүмкін екенін көре аламыз, мысалы, бірақ таңдалған андеррайтердің нақты жауаптарына балама нұсқалар — бұл дерексіз қарсы фактілер. Біз тек болған шешімнің мүмкіндіктер бұлтынан таңдап алынғанын білеміз. Жағдайлық шу — осы көрінбейтін мүмкіндіктер арасындағы өзгермелілік.
Жағдайлық шуды өлшеу
Жағдайлық шуды өлшеу оңай емес — оның бар екені дәлелденгеннен кейін бізді таңғалдыратыны да содан. Адамдар мұқият қаралған кәсіби пікір қалыптастырғанда, оны өз көзқарасын ақтайтын себептермен байланыстырады. Егер олардан өз шешімін түсіндіруді сұраса, олар әдетте оны өздері сенімді деп санайтын уәждермен қорғайды. Ал егер оларға дәл сол мәселе екінші рет ұсынылып, олар оны таныса, күш-жігерді азайту және жүйелілікті сақтау үшін бұрынғы жауабын қайталайды. Мұғалімдік мамандықтан мынадай мысалды қарастырыңыз: егер мұғалім оқушының эссесіне өте жақсы баға берсе, содан кейін бір аптадан соң сол эссені алғашқы бағасын көре отырып қайта оқыса, оның мүлдем басқа баға беруі екіталай.
Осы себепті, істер оңай есте қалатын болса, жағдайлық шуды тікелей өлшеу қиынға соғады. Мысалы, андеррайтерге немесе қылмыстық істер жөніндегі судьяға олар бұрын шешім қабылдаған істі көрсетсеңіз, олар істі танып, бұрынғы шешімін қайталауы мүмкін. Кәсіби пайымдаудағы өзгермелілікті (техникалық тілде тест-қайта тест сенімділігі немесе қысқаша сенімділік деп аталады) зерттеуге шолу жасағанда, сарапшылар бір сессияда екі рет бірдей шешім қабылдаған көптеген зерттеулер қамтылды. Олардың өз-өздерімен келісуге бейім болуы таңқаларлық емес.
Жоғарыда айтылған эксперименттер сарапшылар танымайтын стимулдарды қолдану арқылы бұл мәселені айналып өтті. Шарап судьялары «соқыр» дәм татуға қатысты. Саусақ ізі сарапшыларына бұрын көрген іздері көрсетілді, ал бағдарламалық қамтамасыз ету сарапшыларынан бұрын орындаған тапсырмалары туралы сұралды — бірақ бұл бірнеше апта немесе айдан кейін және оларға бұрын тексерілген істер екені айтылмай жасалды.
Жағдайлық шудың бар екенін растаудың тағы бір, жанама жолы бар: үлкен деректерді және эконометрикалық әдістерді пайдалану. Бұрынғы кәсіби шешімдердің үлкен таңдамасы қолжетімді болғанда, талдаушылар бұл шешімдерге күннің уақыты немесе сыртқы температура сияқты жағдайға тән, қатысы жоқ факторлардың әсер еткен-етпегенін тексере алады. Мұндай қатысы жоқ факторлардың шешімдерге статистикалық маңызды әсері — жағдайлық шудың дәлелі. Шынайы айтсақ, жағдайлық шудың барлық бөгде көздерін табуға үміт жоқ, бірақ табылғандары бұл көздердің үлкен алуан түрлілігін көрсетеді. Егер біз жағдайлық шуды бақылайтын болсақ, оны тудыратын механизмдерді түсінуге тырысуымыз керек.
Бір адам — бұл көпшілік
Мына сұрақ туралы ойланыңыз: әлемдегі әуежайлардың қанша пайызы Америка Құрама Штаттарында орналасқан? Сіз бұл туралы ойлаған кезде, ойыңызға бір жауап келген болар. Бірақ ол сіздің жасыңызды немесе телефон нөміріңізді еске түсіргеніңіз сияқты емес. Сіз жаңа ғана шығарған сан — бұл болжам екенін түсінесіз. Бұл кездейсоқ сан емес — 1% немесе 99% анық қате жауаптар болар еді. Бірақ сіз ойлап тапқан сан — сіз жоққа шығармайтын мүмкіндіктер ауқымындағы біреуі ғана. Егер біреу сіздің жауабыңызға 1 пайыздық тармақты қосса немесе алса, сіз алынған болжамды өзіңіздікінен кем емес қисынды деп табар едіңіз. (Егер білгіңіз келсе, дұрыс жауап — 32%. )
Екі зерттеуші Эдвард Вуль мен Гарольд Пашлер адамдардан осы сұраққа (және көптеген ұқсас сұрақтарға) бір емес, екі рет жауап беруді сұрау идеясын ұсынды. Сыналушыларға бірінші ретте қайтадан болжау керек болатыны айтылған жоқ. Вуль мен Пашлердің болжамы бойынша, екі жауаптың орташа мәні кез келген жеке жауапқа қарағанда дәлірек болады.
Деректер олардың дұрыстығын дәлелдеді. Жалпы алғанда, бірінші болжам екіншісіне қарағанда шындыққа жақынырақ болды, бірақ ең жақсы бағалау екі болжамды орташалау арқылы алынды.
Вуль мен Пашлер көпшілік даналығы (wisdom-of-crowds) әсері деп аталатын белгілі құбылыстан шабыт алды: әртүрлі адамдардың тәуелсіз пайымдауларын орташалау әдетте дәлдікті жақсартады. 1907 жылы Дарвиннің немере ағасы әрі атақты полимат Фрэнсис Гальтон ауыл жәрмеңкесінде 787 ауыл тұрғынынан жүлделі өгіздің салмағын болжауды сұрады. Ауыл тұрғындарының ешқайсысы өгіздің нақты салмағын (1198 фунт) таппады, бірақ олардың болжамдарының орташа мәні 1200 болды, бұл небәрі 2 фунтқа қателескен, ал медианасы (1207) да өте жақын болды. Ауыл тұрғындары «дана көпшілік» болды, өйткені олардың жеке бағалаулары өте шулы болғанымен, олар бейтарап (жүйелі қатесіз) болды. Гальтонның демонстрациясы оны таңғалдырды: ол қарапайым адамдардың пайымдауына аса құрметпен қарамайтын, бірақ соған қарамастан, ол өз нәтижелерін «демократиялық пайымдаудың сенімділігіне күткеннен де көбірек несие береді» деп мәлімдеді.
Ұқсас нәтижелер жүздеген жағдайларда табылды. Әрине, егер сұрақтар соншалықты қиын болып, оған тек сарапшылар ғана жауапқа жақындай алса, көпшілік міндетті түрде өте дәл бола бермейді. Бірақ, мысалы, адамдардан мөлдір құтыдағы желей бұршақтарының санын болжауды, өз қаласындағы бір аптадан кейінгі температураны болжауды немесе штаттағы екі қаланың арақашықтығын бағалауды сұрағанда, көптеген адамдардың орташа жауабы шындыққа жақын болуы ықтимал. Себебі қарапайым статистикада: бірнеше тәуелсіз пайымдауларды (немесе өлшемдерді) орташалау жаңа пайымдау береді, ол жеке пайымдауларға қарағанда шуы азырақ, бірақ бейтараптығы (жүйелі қателігі) бірдей болады.
Вуль мен Пашлер дәл осы әсер жағдайлық шуға да таралатынын білгісі келді: әртүрлі адамдардың болжамдарын біріктіргендегідей, бір адамның екі болжамын біріктіру арқылы шындыққа жақындауға бола ма? Олар анықтағандай, жауап — иә. Вуль мен Пашлер бұл тұжырымға әсерлі атау берді: ішкі көпшілік (the crowd within).
Бір адамның екі болжамын орташалау шешімдерді тәуелсіз екінші пікір іздеу сияқты жақсартпайды. Вуль мен Пашлер айтқандай: «Өзіңізге бір сұрақты екі рет қою арқылы басқа адамнан екінші пікір алғандағы пайданың шамамен 1/10 бөлігін ала аласыз». Бұл үлкен жақсару емес. Бірақ екінші болжам жасауды күте тұру арқылы әсерді әлдеқайда арттыруға болады. Вуль мен Пашлер өз сыналушыларына сол сұрақты қайта қоймас бұрын үш апта уақыт өткізгенде, пайда екінші пікір құнының үштен біріне дейін өсті. Ешқандай қосымша ақпаратты немесе сыртқы көмекті қажет етпейтін әдіс үшін жаман емес. Және бұл нәтиже шешім қабылдаушыларға арналған «ұйықтап тұрып, ертең таңертең қайта ойлан» деген ескі кеңеске негіздеме береді.
Вуль мен Пашлерден тәуелсіз, бірақ шамамен сол уақытта екі неміс зерттеушісі Стефан Герцог пен Ральф Хертвиг дәл осы принциптің басқаша жүзеге асырылуын ойлап тапты. Олар сыналушылардан жай ғана екінші бағалауды шығаруды сұраудың орнына, адамдарды — қисынды болса да — біріншіден барынша ерекшеленетін бағалау жасауға итермеледі. Бұл өтініш сыналушылардан бірінші рет ескермеген ақпарат туралы белсенді ойлануды талап етті. Қатысушыларға арналған нұсқаулықта былай делінген:
Біріншіден, сіздің бірінші бағалауыңыз дұрыс емес деп есептеңіз. Екіншіден, оның себебі болуы мүмкін бірнеше жағдайды ойланыңыз. Қандай болжамдар мен пайымдаулар қате болуы мүмкін еді? Үшіншіден, бұл жаңа пайымдаулар нені білдіреді? Бірінші бағалау тым жоғары немесе тым төмен болды ма? Төртіншіден, осы жаңа перспективаға сүйене отырып, екінші, баламалы бағалау жасаңыз.
Вуль мен Пашлер сияқты, Герцог пен Хертвиг осылайша жасалған екі бағалауды орташалады. Олардың диалектикалық бутстрэппинг (өзіңе қарсы дәлелдер ойлап табу арқылы шешімді жақсарту әдісі) деп атаған әдісі біріншіден кейін бірден екінші бағалауды сұрауға қарағанда дәлдікті көбірек жақсартты. Қатысушылар мәселені жаңа қырынан қарауға мәжбүр болғандықтан, олар өздерінің басқа, ерекше нұсқасын — бір-бірінен алысырақ орналасқан «ішкі көпшіліктің» екі «мүшесін» сынап көрді. Нәтижесінде, олардың орташа мәні шындықтың дәлірек бағасын берді. Екі бірдей «диалектикалық» бағалаудың дәлдігіндегі пайда екінші пікір құнының шамамен жартысын құрады.
Шешім қабылдаушылар үшін Герцог пен Хертвиг қорытындылағандай, бұл процедуралар арасындағы қарапайым таңдау: егер сіз басқалардан тәуелсіз пікір ала алсаңыз, оны жасаңыз — бұл нағыз көпшілік даналығы сіздің пайымдауыңызды жақсартуы әбден мүмкін. Егер мүмкін болмаса, «ішкі көпшілік» құру үшін сол шешімді өзіңіз екінші рет жасаңыз. Сіз мұны біраз уақыт өткен соң — бірінші пікіріңізден алшақтаған соң — немесе мәселеге басқа көзқарас табу үшін өз-өзіңізге қарсы уәж айтуға белсенді тырысу арқылы жасай аласыз. Соңында, көпшіліктің түріне қарамастан, егер сізде бағалаулардың біріне көбірек салмақ салуға өте күшті себептер болмаса, ең жақсы нұсқа — оларды орташалау.
Практикалық кеңестерден басқа, бұл зерттеу бағыты пайымдау туралы маңызды түсінікті растайды. Вуль мен Пашлер айтқандай: «Сыналушының жауаптары оның барлық біліміне сүйене отырып детерминистік түрде таңдалмайды, керісінше ішкі ықтималдық таралуынан алынады». Бұл бақылау сіздің Америка Құрама Штаттарындағы әуежайлар туралы сұраққа жауап бергендегі тәжірибеңізді қайталайды: Сіздің бірінші жауабыңыз барлық біліміңізді немесе тіпті оның ең жақсы бөлігін қамтыған жоқ. Жауап сіздің ойыңыз тудыруы мүмкін ықтимал жауаптар бұлтындағы бір нүкте ғана болды. Бір адамның бір мәселе бойынша пайымдауларында біз бақылайтын өзгермелілік — бұл бірнеше жоғары мамандандырылған мәселелерде кездесетін кездейсоқтық емес: жағдайлық шу біздің барлық пайымдауларымызға әрқашан әсер етеді.
Жағдайлық шудың көздері
Жағдайлық шудың бәріміз байқаған кем дегенде бір көзі бар: көңіл-күй. Өз шешімдеріміздің қалай сезінетінімізге байланысты болатынын бәріміз бастан өткердік және басқалардың шешімдері де олардың көңіл-күйіне қарай өзгеретінін жақсы білеміз.
Көңіл-күйдің пайымдауға әсері көптеген психологиялық зерттеулердің нысаны болды. Адамдарды уақытша бақытты немесе мұңды ету және осы көңіл-күйлер тудырылғаннан кейін олардың пайымдаулары мен шешімдерінің өзгермелілігін өлшеу таңқаларлықтай оңай. Зерттеушілер мұны істеу үшін әртүрлі әдістерді қолданады. Мысалы, қатысушылардан кейде бақытты немесе мұңды естелікті еске түсіріп, абзац жазу сұралады. Кейде олар жай ғана күлкілі фильмнен немесе драмалық фильмнен алынған бейне үзіндіні көреді.
Бірнеше психолог көңіл-күй манипуляциясының әсерін зерттеуге ондаған жылдар жұмсады. Мүмкін, ең жемістісі — австралиялық психолог Джозеф Форгас. Ол көңіл-күй тақырыбында жүзге жуық ғылыми мақала жариялады.
Форгастың кейбір зерттеулері сіздің ойыңызды растайды: көңіл-күйі жақсы адамдар әдетте позитивті болады. Оларға мұңды естеліктерге қарағанда бақытты сәттерді еске түсіру оңайырақ, олар адамдарды көбірек қолдайды, жомарт және көмекшіл болады және т. б. Жағымсыз көңіл-күй қарама-қайшы әсер береді. Форгас жазғандай: «Көңіл-күйі жақсы адам достық ретінде қабылдайтын күлкіні, жағымсыз көңіл-күйдегі бақылаушы оғаш деп бағалауы мүмкін; ауа райын талқылау көңіл-күйі жақсы адамға салмақты көрінгенімен, көңіл-күйі нашар адамға іш пыстырарлық болып көрінуі мүмкін».
Басқаша айтқанда, көңіл-күй сіздің не ойлайтыныңызға: қоршаған ортада нені байқайтыныңызға, жадыңыздан нені алатыныңызға, бұл сигналдарды қалай мағыналайтыныңызға өлшенетін әсер етеді. Бірақ көңіл-күйдің тағы бір, таңқаларлық әсері бар: ол сондай-ақ сіздің қалай ойлайтыныңызды да өзгертеді. Мұндағы әсерлер сіз елестеткендей болмауы мүмкін. Жақсы көңіл-күйде болу — бұл аралас бақыт, ал жаман көңіл-күйдің де жақсы жағы бар. Әртүрлі көңіл-күйдің шығындары мен пайдасы жағдайға байланысты болады.
Мәселен, келіссөздер жүргізу кезінде жақсы көңіл-күй көмектеседі. Көңіл-күйі жақсы адамдар көбірек ынтымақтастық танытады және өзара сыйластық тудырады. Олар әдетте бақытсыз келіссөзшілерге қарағанда жақсы нәтижелерге қол жеткізеді. Әрине, сәтті келіссөздер де адамдарды бақытты етеді, бірақ бұл эксперименттерде көңіл-күй келіссөзде болып жатқан жағдайдан туындамайды; ол адамдар келіссөз жүргізбес бұрын тудырылады. Сондай-ақ, келіссөз барысында жақсы көңіл-күйден ашулы күйге ауысатын келіссөзшілер жиі жақсы нәтижелерге қол жеткізеді — бұл қырсық қарсыласпен кездескенде есте сақтайтын нәрсе!
Екінші жағынан, жақсы көңіл-күй біздің бірінші әсерімізді күмәнсіз қабылдауға бейім етеді. Форгастың зерттеулерінің бірінде қатысушылар автордың суреті тіркелген қысқаша философиялық эссені оқыды. Кейбір оқырмандар стереотипті философия профессорын — көзілдірік киген, орта жастағы ер адамды көрді. Басқалары жас әйелді көрді. Өздеріңіз болжағандай, бұл оқырмандардың стереотиптерге бейімділігін тексеру: адамдар эссені жас әйел жазды деп сенгеннен көрі, орта жастағы ер адамға телінген кезде жоғарырақ бағалай ма? Әрине, солай. Бірақ маңыздысы, жақсы көңіл-күй жағдайында айырмашылық үлкенірек болды. Көңіл-күйі көтеріңкі адамдар өздерінің бейтараптығына (bias) ойлау процесіне әсер етуге көбірек жол береді.
Басқа зерттеулер көңіл-күйдің сенгіштікке әсерін тексерді. Гордон Пенникук пен оның әріптестері танымал гурулардың сөздерінен кездейсоқ таңдалған зат есімдер мен етістіктерді грамматикалық тұрғыдан дұрыс сөйлемдерге құрастыру арқылы жасалған мағынасыз, «терең мағыналы» болып көрінетін мәлімдемелерге адамдардың реакциясын зерттеді. Мысалы: «Тұтастық шексіз құбылыстарды тыныштандырады» немесе «Жасырын мағына теңдессіз дерексіз сұлулықты өзгертеді». Мұндай мәлімдемелермен келісуге бейімділік балшитқа (бос сөзге) бейімділік ретінде белгілі. (Bullshit Принстон университетінің философы Гарри Франкфурт «On Bullshit» атты түсінікті кітабын жариялағаннан бері техникалық терминге айналды, онда ол «балшитты» басқа бұрмалау түрлерінен ажыратып көрсетті. )
Әрине, кейбір адамдар басқаларға қарағанда «балшитка» көбірек бейім. Оларға «шынайы және мағыналы болып көрінетін, бірақ шын мәнінде бос мәлімдемелер» әсер етуі мүмкін. Бірақ бұл жерде де бұл сенгіштік тек тұрақты, өзгермейтін мінез-құлықтың функциясы емес. Жақсы көңіл-күйді тудыру адамдарды бос сөзге бейім және жалпы сенгіш етеді; олар алдауды байқауға немесе жаңылыстыратын ақпаратты анықтауға азырақ қабілетті болады. Керісінше, жаңылыстыратын ақпаратқа тап болған куәгерлер жаман көңіл-күйде болғанда, оны ескермеуге және жалған айғақтардан аулақ болуға жақсырақ қабілетті болады.
Тіпті моральдық пайымдауларға да көңіл-күй қатты әсер етеді. Бір зерттеуде зерттеушілер сыналушыларға моральдық философиядағы классикалық мәселе — «жаяу жүргіншілер көпірі» мәселесін ұсынды. Бұл ойша экспериментте бес адам бақылаудан шығып кеткен вагонетканың астында қалып өлуге шақ тұр. Сыналушылар өздерін вагонетка өтетін жаяу жүргіншілер көпірінде тұрмыз деп елестетуі керек. Олар ірі денелі адамды көпірден рельске итеріп жіберу туралы шешім қабылдауы керек, сонда оның денесі вагонетканы тоқтатады. Егер олар солай жасаса, ірі денелі адам өледі, бірақ бес адам аман қалады.
Жолаушылар көпірі мәселесі адамгершілік пайымдаудағы тәсілдер арасындағы қайшылықты айқын көрсетеді. Ағылшын философы Джереми Бентаммен байланысты утилитарлық есептеу (іс-әрекеттің дұрыстығын оның әкелетін пайдасымен немесе нәтижесімен өлшейтін тәсіл) бес адамның өмірін сақтау үшін бір адамның қаза болуын жөн деп санайды. Ал Иммануил Канттың есімімен байланысты деонтологиялық этика (іс-әрекеттің адамгершілік ережелері мен міндеттерге сәйкестігін бағалайтын ілім) тіпті бірнеше адамды құтқару үшін де біреуді өлтіруге қатаң тыйым салады. Көпір мәселесінде жеке эмоцияның айқын элементі бар: адамды көпірден келе жатқан пойыздың алдына итеріп жіберу — өте жиіркенішті әрекет. Көпірден адамды итеріп жіберу туралы утилитарлық таңдау жасау үшін адам бейтаныс жанға қарсы физикалық зорлық-зомбылыққа деген жиіркенішін жеңуі керек. Әдетте адамдардың аз ғана бөлігі (бұл зерттеуде он адамның біреуіне де жетпейтіні) мұндай қадамға баратынын айтады.
Алайда, бес минуттық видеоролик көру арқылы субъектілерде жағымды көңіл-күй қалыптасқанда, олардың адамды көпірден итеріп жіберуге келісу ықтималдығы үш есе артқан. «Өлтірме» дегенді абсолютті принцип ретінде қабылдауымыз немесе бес адамды құтқару үшін бір бейтаныс адамды өлтіруге дайын болуымыз біздің ең терең құндылықтарымызды көрсетуі тиіс. Бірақ біздің таңдауымыз жаңа ғана қандай видео көргенімізге байланысты сияқты болып көрінеді.
Біз көңіл-күй туралы бұл зерттеулерді егжей-тегжейлі сипаттадық, өйткені маңызды бір шындықты атап өткіміз келеді: сіз әрқашан бірдей адам емессіз. Көңіл-күйіңіз өзгерген сайын (сіз мұны байқайсыз), когнитивті механизміңіздің кейбір сипаттамалары да сонымен бірге өзгереді (мұны сіз толық сезінбейсіз). Егер сізге күрделі пайымдау мәселесі берілсе, сол сәттегі көңіл-күйіңіз мәселеге деген көзқарасыңыз бен жасаған қорытындыңызға әсер етуі мүмкін. Тіпті сіз көңіл-күйімнің ешқандай әсері жоқ деп сенсеңіз де және тапқан жауабыңызды сенімді түрде негіздей алсаңыз да, бұл солай. Қысқасы, сіз шулысыз (бұл контексте — шешім қабылдаудағы кездейсоқ ауытқушылықтарға бейімділік).
Пайымдаулардағы жағдаяттық шуды (бір адамның бір мәселе бойынша әртүрлі уақытта әртүрлі шешім қабылдауы) басқа да көптеген кездейсоқ факторлар тудырады. Кәсіби пайымдауларға әсер етпеуі тиіс, бірақ іс жүзінде әсер ететін бөгде факторлардың ішінде екі негізгі күдікті бар: стресс және шаршау. Мысалы, жеті жүз мыңға жуық алғашқы медициналық көмек көрсету сапарларын зерттеу дәрігерлердің ұзақ жұмыс күнінің соңында опиоидтарды (күшті ауырсынуды басатын дәрілер) жазып беру ықтималдығы айтарлықтай жоғары екенін көрсетті. Сағат 16:00-де келген пациенттің сағат 9:00-де келген адамнан көбірек ауырсыну сезінуіне ешқандай негіз жоқ. Сондай-ақ, дәрігердің кестеден қалып қоюы рецепт бойынша шешім қабылдауға әсер етпеуі тиіс. Шынында да, стероидты емес қабынуға қарсы препараттар сияқты басқа емдеу түрлері мұндай заңдылықты көрсетпейді. Дәрігерлер уақыт тығыздығында болғанда, олар елеулі кемшіліктеріне қарамастан, «тез шешім» жолын таңдауға бейім болады. Басқа зерттеулер жұмыс күнінің соңына қарай дәрігерлердің антибиотиктерді көбірек жазып беретінін, ал тұмауға қарсы екпелерді сирек ұсынатынын көрсетті.
Тіпті ауа райының өзі кәсіби пайымдауларға өлшенетіндей әсер етеді. Бұл шешімдер көбінесе кондиционері бар бөлмелерде қабылданғандықтан, ауа райының әсері көңіл-күй арқылы «жанама» түрде жүзеге асады. Жаман ауа райы жадының жақсаруымен байланысты; далада күн ыстық болғанда сот үкімдері қаталдау болады; ал қор нарығының көрсеткіштеріне күн сәулесі әсер етеді. Кейбір жағдайларда ауа райының әсері соншалықты айқын емес. Ури Симонсон колледжге қабылдау комиссиясының мүшелері бұлтты күндері үміткерлердің академиялық жетістіктеріне, ал шуақты күндері академиялық емес қасиеттеріне көбірек мән беретінін көрсетті. Оның бұл нәтижелерді жариялаған мақаласының тақырыбы өте есте қаларлық: «Бұлтты күндері 'ботаниктер' жақсырақ көрінеді».
Пайымдаудағы кездейсоқ құбылмалылықтың тағы бір көзі — істердің қаралу реті. Адам белгілі бір істі қарастырып жатқанда, оның алдындағы шешімдер бейсаналы түрде салыстыру негізіне айналады. Бірінен соң бірі шешім қабылдайтын мамандар — судьялар, несие мамандары және бейсбол төрешілері — тепе-теңдікті қалпына келтіруге тырысады: бір бағыттағы шешімдер сериясынан кейін олар келесі шешімді қарама-қайшы бағытта қабылдауға бейім болады. Нәтижесінде қателіктер мен әділетсіздіктерден қашу мүмкін болмайды. Мысалы, АҚШ-тағы баспана беру мәселесін қарайтын судьялар, егер алдыңғы екі істе оң шешім берілген болса, келесі үміткерге баспана беру ықтималдығын 19%-ға төмендетеді. Бұл мінез-құлық ойыншы қателігі (кездейсоқ оқиғалардың алдыңғы нәтижелерге тәуелді екеніне қатысты жаңсақ сенім) деп аталатын когнитивті бұрмалануды көрсетеді.
Жағдаяттық шудың көлемін анықтау
Жалпы жүйелік шумен салыстырғанда жағдаяттық шу қаншалықты үлкен? Барлық жағдайға ортақ бір сан болмаса да, жалпы ереже бар: бұл тарауда сипатталған әсерлердің көлемі жеке тұлғалар арасындағы тұрақты айырмашылықтардан кішірек.
Мысалы, АҚШ-та баспана сұраушының қабылдану мүмкіндігі, егер оның алдындағы екі іс сәтті өткен болса, 19%-ға төмендейді. Бұл құбылмалылық алаңдатарлық жайт. Бірақ бұл судьялар арасындағы айырмашылықпен салыстырғанда түк емес: Майамидегі бір сотта зерттеушілер бір судьяның үміткерлердің 88%-ына баспана беретінін, ал екіншісінің тек 5%-ына ғана беретінін анықтады. Мұндай үлкен алшақтықтарды ескерсек, бұл сандардың бірін 19%-ға азайту аса үлкен мәселе болып көрінбейді.
Басқаша айтқанда, сіз әрдайым бірдей адам емессіз және уақыт өте келе өзіңіз ойлағаннан гөрі тұрақсызырақсыз. Бірақ сіз бүгінгі басқа адамға қарағанда, кешегі өзіңізге көбірек ұқсайсыз.
Жағдаяттық шу, ішкі себептер
Майкл Кахана және оның Пенсильвания университетіндегі әріптестері жадының жұмысын зерттейді. Бір зерттеуде олар жетпіс тоғыз субъектіден жиырма үш күн бойы күн сайын жиырма төрт сөзден тұратын жиырма төрт тізімді есте сақтауды сұрады. Зерттеушілерді субъектілер арасындағы айырмашылық емес, әр адамның жұмыс өнімділігіндегі құбылмалылықтың себептері қызықтырды. Өнімділікке сергектік, ұйқының мөлшері немесе күннің уақыты әсер ете ме?
Барлық сұрақтардың жауабы «иә» болды, бірақ әсері өте аз еді. Барлық осы факторларды қамтитын модель субъектінің өнімділігіндегі ауытқудың тек 11%-ын ғана түсіндірді. Зерттеушілер айтқандай: «Барлық болжамды факторлардың әсерін алып тастағаннан кейін де қаншалықты құбылмалылық қалғанына таң қалдық». Тіпті осындай қатаң бақыланатын жағдайда да, жағдаяттық шуды қозғаушы факторлар жұмбақ болып қалды.
Ең күшті болжамды фактор сыртқы емес, ішкі болып шықты. Сөздер тізімін есте сақтау көрсеткіші оның алдындағы тізімнің көрсеткішіне байланысты болды. Сәттілік пен сәтсіздік толқын сияқты ауысып отырды, бұған ешқандай айқын сыртқы себеп болмады. Бұл тұжырымдар жадының жұмысы көбінесе эндогендік нейрондық процестердің (ағзаның ішкі факторларынан туындайтын жүйке процестері) тиімділігіне байланысты екенін көрсетеді. Басқаша айтқанда, мидың жұмыс істеу тиімділігінің сәт сайынғы ауытқуы тек ауа райы сияқты сыртқы әсерлерден емес, миымыздың өзінің жұмыс істеу ерекшелігінен туындайды.
Ми жұмысындағы ішкі құбылмалылық біздің пайымдауларымыздың сапасына біз бақылай алмайтын деңгейде әсер етеді. Егер біздің санамыз өлшеу құралы болса, ол ешқашан мінсіз болмайды. Дегенмен, біз бақылауға болатын бөгде әсерлерді тізгіндеуге тырыса аламыз. Бұл, әсіресе, топтық шешімдер қабылдағанда маңызды.
Жағдаяттық шу туралы айтсақ
«Пайымдау — бұл еркін лақтыру сияқты: оны қаншалықты дәл қайталауға тырыссақ та, ол ешқашан бірдей болмайды».
«Сіздің пайымдауыңыз көңіл-күйіңізге, жаңа ғана талқылаған істеріңізге, тіпті ауа райына байланысты. Сіз әрқашан бірдей адам емессіз».
«Сіз өткен аптадағы өзіңізден айтарлықтай ерекшеленбесеңіз де, бүгінгі басқа адамға қарағанда өткен аптадағы өзіңізге көбірек ұқсайсыз. Жағдаяттық шу — жүйелік шудың ең үлкен көзі емес».
8-ТАРАУ
Топтар шуды қалай күшейтеді
Жеке пайымдаудағы шу онсыз да жеткілікті. Бірақ топтық шешім қабылдау мәселеге тағы бір қабат қосады. Кім бірінші сөйлейді, кім соңғы сөйлейді, кім сенімді сөйлейді, кім қара киім киген, кім кімнің қасында отыр, кім қажетті сәтте жымиды немесе қабақ түйеді — осы факторлардың барлығы нәтижеге әсер етеді.
Бірнеше адамның пайымдауларын біріктіру шуды азайтатынын айтқан болатынбыз. Бірақ топтық динамиканың кесірінен топтар шуды көбейтуі де мүмкін. Орташа пайымдауы дұрыс жауапқа жақын болатын «дана топтар» бар, бірақ сонымен бірге тирандардың соңынан еретін, нарықтық көпіршіктерді қоздыратын немесе ортақ елеске сенетін топтар да болады.
Музыкадағы шу
Мэттью Салганик пен оның әріптестерінің музыка жүктеу бойынша жүргізген ауқымды зерттеуін қарастырайық. Зерттеушілер мыңдаған адамнан тұратын бақылау тобын құрды. Бұл топтың мүшелері жаңа топтардың жетпіс екі әнін тыңдап, жүктей алды. Бақылау тобындағы қатысушыларға басқалардың не істегені туралы ештеңе айтылмады. Олар қандай әндерді ұнататыны туралы өз бетінше шешім қабылдады. Бірақ Салганик тағы сегіз топ құрды. Ол топтардың мүшелері өз тобындағы қанша адамның әр әнді жүктегенін көре алды.
Топтар арасында айтарлықтай айырмашылық болмағандықтан, зерттеу іс жүзінде «тарихты сегіз рет қайталау» сияқты болды. Нәтижесінде топтардың рейтингтері бір-бірінен мүлдем өзгеше болып шықты. Бір топта «Best Mistakes» әні зор жетістікке жетсе, басқа топта ол сәтсіздікке ұшырауы мүмкін еді. Егер ән ерте танымалдылыққа ие болса, ол өте жоғары көтерілді. Қысқасы, әлеуметтік ықпал (басқа адамдардың іс-әрекеті мен пікіріне сүйеніп шешім қабылдау) топтар арасында айтарлықтай шу тудырады.
Танымалдылық — бұл өзін-өзі күшейтетін процесс. Зерттеушілер рейтингтерді әдейі ауыстырып қойғанда (яғни, танымал емес әндерді танымал деп өтірік көрсеткенде), адамдар сол «танымал» деп көрсетілген әндерді көбірек жүктей бастаған. Тек ең танымал ән ғана уақыт өте келе өз орнына қайта оралды. Қалған жағдайларда жасанды рейтинг түпкілікті нәтижені анықтады.
Бұл зерттеулердің жалпы топтық пайымдауларға қандай қатысы бар? Айталық, он адамнан тұратын топ жаңа бастаманы қабылдау туралы шешім қабылдап жатыр. Егер бірінші болып сөйлеген бір-екі адам бастаманы қолдаса, олар бүкіл аудиторияның пікірін өз бағытына бұруы мүмкін. Егер бірінші болып скептиктер (күмәнданушылар) сөйлесе, нәтиже керісінше болады. Осылайша, бірдей топтар тек кім бірінші сөйлегеніне байланысты мүлдем әртүрлі шешімдер қабылдауы мүмкін.
Музыка жүктеуден тыс
Ұлыбританиядағы референдум ұсыныстарының танымалдылығы да осындай заңдылыққа бағынады: алғашқы танымалдылық толқыны өзін-өзі күшейтеді. Саясатта да, музыкадағы сияқты, көп нәрсе әлеуметтік ықпалға және адамдардың басқалардың пікірін көру-көрмеуіне байланысты.
Корнелл университетінің әлеуметтанушысы Майкл Мэйсидің зерттеуі көрсеткендей, егер Демократтар тобы белгілі бір көзқарастың өз партияластары арасында танымал болып жатқанын көрсе, оны бірден қолдайды. Ал егер сол көзқарасты Республикашылдар арасында танымал деп көрсе, оны бірден теріске шығарады. «Алғашқы қадам жасаушылардың» кездейсоқ әрекеттері үлкен халық топтарының пікірін өзгертуге жеткілікті.
Лев Мучник жүргізген зерттеуде веб-сайттағы пікірлерге жасанды түрде бір ғана «жоғары дауыс» (up vote) берілгенде, келесі оқырманның оған оң баға беру ықтималдығы 32%-ға артқан. Мыңдаған келушілері бар сайтта бір ғана алғашқы дауыстың осындай үлкен әсері болатыны таң қалдырады.
Таңғаларлығы, бұл әсер уақыт өте келе сақталып қалды. Бес айдан кейін бір ғана жасанды оң дауыс пікірлердің орташа рейтингін 25%-ға арттырды. Ерте берілген бір ғана оң дауыстың әсері — шудың (түрлі жағдайларға байланысты шешімдердің негізсіз алшақтауы) нағыз рецепті. Ол дауыстың себебі қандай болса да, ол жалпы танымалдылықтың ауқымды өзгеруіне әкелуі мүмкін.
Бұл зерттеу топтардың қалай өзгеретіні және неге оларда шу көп болатыны туралы мәлімет береді (тағы да айта кетсек, ұқсас топтар өте әртүрлі пайымдаулар жасай алады, ал жекелеген топтардың шешімдері мүмкін болатын көптеген нұсқалардың бірі ғана болып шығады). Топ мүшелері көбінесе келісім, бейтараптық немесе қарсылық білдіру арқылы ерте берілген оң (немесе теріс) дауыстың функционалдық баламасын ұсыну мүмкіндігіне ие. Егер топ мүшесі бірден мақұлдау берсе, басқа мүшелерде де солай істеуге негіз пайда болады. Топтар белгілі бір өнімдерге, адамдарға, қозғалыстарға немесе идеяларға бет бұрғанда, бұл олардың ішкі құндылығынан емес, ерте берілген оң дауыстардың функционалдық баламасынан болуы мүмкін екендігінде күмән жоқ. Әрине, Мучниктің жеке зерттеуі өте үлкен топтарды қамтыды. Бірақ дәл осындай жағдай шағын топтарда да болуы мүмкін, тіпті одан да айқынырақ байқалады, өйткені қандай да бір жоспарды, өнімді немесе үкімді қолдап берілген алғашқы дауыс көбінесе басқаларға үлкен әсер етеді.
Мұнымен байланысты тағы бір жайт бар. Біз көпшілік даналығына (көп адамнан тұратын топтың орташа жауабы шындыққа жақын болуы) тоқталған болатынбыз: егер сіз үлкен топтан сұрақ сұрасаңыз, орташа жауаптың нысанаға жақын болу ықтималдығы жоғары. Пайымдауларды біріктіру — шуды, демек, қателікті азайтудың тамаша тәсілі. Бірақ адамдар бір-бірін тыңдаса не болады? Бұл көмектесуі мүмкін деп ойлауыңыз мүмкін. Өйткені, адамдар бір-бірінен үйреніп, не дұрыс екенін түсіне алады. Адамдар өз білгендерімен бөлісетін қолайлы жағдайларда, ақылдасатын топтар шынымен де жақсы нәтиже көрсете алады. Бірақ тәуелсіздік — көпшілік даналығының міндетті шарты. Егер адамдар өз бетінше пайымдау жасамай, керісінше, басқалардың не ойлайтынына сүйенетін болса, көпшілік онша дана болмай шығуы мүмкін.
Зерттеулер дәл осы мәселені анықтады. Қарапайым бағалау тапсырмаларында — қалалық жердегі қылмыс саны, белгілі бір кезеңдегі халық санының өсуі, елдер арасындағы шекараның ұзындығы — адамдар өз көзқарастарын тәуелсіз түрде тіркеген жағдайда көпшілік шынымен де дана болды. Бірақ егер олар басқа адамдардың бағалауларын білсе (мысалы, он екі адамнан тұратын топтың орташа бағасын), көпшіліктің нәтижесі нашарлады. Авторлар айтқандай, әлеуметтік әсерлер мәселе тудырады, өйткені олар «ұжымдық қателікті азайтпастан, топтық әртүрлілікті төмендетеді». Қызығы сол, тиісті түрде біріктірілген көптеген тәуелсіз пікірлер таңқаларлықтай дәл болуы мүмкін болса, тіпті шамалы әлеуметтік әсердің өзі көпшілік даналығына нұқсан келтіретін «тобырлық мінез-құлықты» тудыруы мүмкін.
Каскадтар
Біз сипаттап отырған кейбір зерттеулер ақпараттық каскадтарды (бір адамның шешімі басқаларға тізбекті түрде әсер ету процесі) қамтиды. Мұндай каскадтар барлық жерде кездеседі. Олар бизнестегі, үкіметтегі және басқа салалардағы ұқсас топтардың неге әртүрлі бағыттарға кететінін және неге шағын өзгерістер осындай әртүрлі нәтижелерді, демек, шуды тудыратынын түсіндіруге көмектеседі. Біз тарихты тек болған күйінде көре аламыз, бірақ көптеген топтар мен топтық шешімдер үшін мүмкіндіктердің тұтас бұлты болады, олардың тек біреуі ғана жүзеге асады.
Ақпараттық каскадтардың қалай жұмыс істейтінін көру үшін, үлкен кеңседе он адамның маңызды лауазымға кімді жұмысқа алуды шешіп жатқанын елестетіңіз. Үш негізгі үміткер бар: Томас, Сэм және Джули. Топ мүшелері өз пікірлерін кезекпен айтып жатыр деп есептейік. Әрбір адам, әрине, басқалардың пайымдауларына назар аударады. Артур бірінші болып сөйлейді. Ол ең жақсы таңдау — Томас деп ұсынады. Барбара енді Артурдың пайымдауын біледі; егер ол да Томасты қолдаса, оның пікірімен келісуі керек. Бірақ ол ең жақсы үміткердің кім екеніне сенімді емес делік. Егер ол Артурға сенсе, жай ғана келісе салуы мүмкін: Томас — ең жақсысы. Ол Артурға жеткілікті түрде сенгендіктен, оның пайымдауын қолдайды.
Енді үшінші адам Чарльзға назар аударайық. Артур да, Барбара да Томасты жұмысқа алғысы келетінін айтты, бірақ Чарльздың өзінде бар шектеулі ақпаратқа негізделген жеке пікірі бойынша, Томас бұл жұмысқа лайықты адам емес, ал Джули — ең жақсы үміткер. Чарльз осындай пікірде болса да, ол өзінің білетінін елемей, жай ғана Артур мен Барбараның соңынан еруі мүмкін. Егер солай болса, оның себебі Чарльздың қорқақтығында емес. Керісінше, ол сыпайы тыңдаушы болғандықтан. Ол Артур мен Барбараның өз таңдауларына негізі бар деп ойлауы мүмкін.
Егер Дэвид өзінің ақпараты оның алдындағылардың ақпаратынан шынымен жақсырақ деп ойламаса, ол олардың соңынан еріп, солай істейді. Егер ол солай істесе, Дэвид каскадтың ішінде. Шынында да, егер оның Артур, Барбара және Чарльздың қателесетініне өте күшті негіздері болса, ол қарсы тұрар еді. Бірақ ондай негіздер болмаса, ол олармен келісе салуы ықтимал.
Маңыздысы, Чарльз немесе Дэвидте Томас (немесе басқа үміткерлер) туралы Артур мен Барбара білмейтін ақпарат немесе түсініктер болуы мүмкін. Егер бұл бөлісілгенде, бұл жеке ақпарат Артурдың немесе Барбараның көзқарасын өзгертуі мүмкін еді. Егер Чарльз бен Дэвид бірінші сөйлегенде, олар тек үміткерлер туралы өз пікірлерін білдіріп қана қоймай, басқа қатысушылардың ойын өзгерте алатын ақпарат қосар еді. Бірақ олар соңынан сөйлегендіктен, олардың жеке ақпараты жеке күйінде қалуы әбден мүмкін.
Енді Эрика, Фрэнк және Джордж өз пікірлерін білдіреді деп күтілуде делік. Егер Артур, Барбара, Чарльз және Дэвид бұған дейін Томас ең жақсысы деп айтса, олардың әрқайсысы басқа таңдау жақсырақ болатынына негізді себептері болса да, дәл солай айтуы мүмкін. Әрине, егер бұл анық қате болса, олар қалыптасып жатқан консенсусқа қарсы шығуы мүмкін. Бірақ шешім анық болмаса ше? Бұл мысалдың мәні мынада: Артурдың алғашқы пайымдауы бірнеше адамның каскадқа қатысуына әкелетін процесті бастады, нәтижесінде топ бірауыздан Томасты таңдады — тіпті оны қолдайтындардың кейбіреуінде нақты пікір болмаса да және басқалары оны мүлдем ең жақсы таңдау деп есептемесе де.
Бұл мысал, әрине, өте жасанды. Бірақ кез келген түрдегі топтардың ішінде осыған ұқсас жағдай үнемі болып тұрады. Адамдар басқалардан үйренеді, егер алғашқы сөйлеушілерге бір нәрсе ұнаса немесе бір нәрсені істегісі келсе, басқалары келісуі мүмкін. Тым болмаса, егер олардың сенбеуге себебі болмаса және олардың қателесетіні туралы жақсы негізі болмаса, солай болады.
Біздің мақсатымыз үшін ең маңызды жайт — ақпараттық каскадтар топтар арасында шудың пайда болуын ықтимал, тіпті болмай қоймайтын жағдайға айналдырады. Біз келтірген мысалда Артур бірінші болып сөйлеп, Томасты қолдады. Бірақ Барбара бірінші сөйлеп, Сэмді қолдады делік. Немесе Артур сәл басқаша сезініп, Джулиді таңдады делік. Ықтимал болжамдар бойынша, топ Сэмге немесе Джулиге бет бұрар еді, бұл олардың жақсырақ болғанынан емес, каскадтың солай өрбігенінен болар еді. Бұл музыка жүктеу экспериментінің (және соған ұқсас басқаларының) негізгі тұжырымы.
Адамдардың ақпараттық каскадтарға қатысуы міндетті түрде қисынсыз емес екенін ескеріңіз. Егер адамдар кімді жұмысқа алу керектігіне сенімсіз болса, басқалардың соңынан ергені ақылдылық болуы мүмкін. Бір пікірді бөлісетін адамдардың саны артқан сайын, оларға сену одан сайын қисынды көрінеді. Соған қарамастан, екі мәселе бар. Біріншіден, адамдар көпшіліктің көп бөлігі де каскадтың ішінде болуы мүмкін екенін және олардың өз бетінше тәуелсіз пайымдау жасамай жатқанын ескермейді. Үш, он немесе жиырма адамның қандай да бір тұжырымды қолдап отырғанын көргенде, біз олардың барлығы өз алдындағылардың соңынан еріп отырған дәрежесін жетерліктей бағаламауымыз мүмкін. Біз олардың ортақ келісімі тек бірнеше адамның бастапқы көзқарасын көрсетсе де, ұжымдық даналықты көрсетеді деп ойлауымыз мүмкін. Екіншіден, ақпараттық каскадтар адамдар тобын шынымен қорқынышты бағыттарға апаруы мүмкін. Өйткені, Артур Томас туралы қателескен болуы мүмкін.
Ақпарат, әрине, топ мүшелерінің бір-біріне әсер етуінің жалғыз себебі емес. Әлеуметтік қысым да маңызды рөл атқарады. Компанияда немесе үкіметте адамдар жағымсыз, ұрысқақ, ақылсыз немесе ақымақ болып көрінбеу үшін үндемеуі мүмкін. Олар «командалық ойыншы» болғысы келеді. Сондықтан олар басқалардың көзқарастары мен іс-әрекеттеріне ілеседі. Адамдар не дұрыс немесе не дұрыс болуы мүмкін екенін білемін деп ойлайды, бірақ соған қарамастан, топтың жақсы ықыласында қалу үшін топтың айқын консенсусымен немесе алғашқы сөйлеушілердің пікірлерімен келіседі.
Кішкене өзгерістермен, жұмысқа алу туралы жоғарыда айтылған оқиға дәл осылай өрбуі мүмкін, бұл адамдардың Томастың артықшылықтары туралы бір-бірінен үйренуінен емес, жағымсыз немесе күлкілі болып көрінгісі келмеуінен болады. Артурдың Томастың пайдасына айтқан ерте пайымдауы «көпшілікке ілесу» әсерін бастауы мүмкін, бұл соңында Эрикаға, Фрэнкке немесе Джорджға күшті әлеуметтік қысым жасайды, себебі қалғандарының бәрі Томасты қолдап қойды. Ақпараттық каскадтардағы сияқты, әлеуметтік қысым каскадтарында да адамдар өздерінен бұрын сөйлегендердің сенімін асыра сілтеп қабылдауы мүмкін. Егер адамдар Томасты қолдап жатса, олар мұны Томасты шынымен қалағандықтан емес, алғашқы немесе ықпалды сөйлеуші оны қолдағандықтан жасауы мүмкін. Соған қарамастан, топ мүшелері консенсусқа өз дауыстарын қосып, әлеуметтік қысым деңгейін арттыра түседі. Бұл компаниялар мен үкіметтік кеңселердегі таныс құбылыс және ол мүлдем қате пайымдауға деген сенімділікке және бірауыздан қолдауға әкелуі мүмкін.
Топтар арасында әлеуметтік әсерлер де шу тудырады. Егер біреу жиналысты компания бағытындағы үлкен өзгерісті қолдаудан бастаса, сол адам топтың бұл өзгерісті бірауыздан қолдауына әкелетін талқылауды бастауы мүмкін. Олардың келісімі сенімнің емес, әлеуметтік қысымның нәтижесі болуы мүмкін. Егер басқа біреу жиналысты басқа көзқарасты білдіруден бастаса немесе алғашқы сөйлеуші үндемеуге шешім қабылдаса, талқылау мүлдем басқа бағытқа кетер еді — және дәл сол себеппен. Өте ұқсас топтар әлеуметтік қысымның кесірінен әртүрлі нәтижелерге жетуі мүмкін.
Топтық поляризация
Америка Құрама Штаттарында және басқа да көптеген елдерде қылмыстық істер (және көптеген азаматтық істер) әдетте алқабилер сотымен қаралады. Алқабилер өз талқылаулары арқылы осы консультативтік органдарды құрайтын жеке тұлғаларға қарағанда дана шешімдер қабылдайды деп үміттенуге болады. Алайда, алқабилерді зерттеу шудың қайнар көзі болып табылатын әлеуметтік әсердің ерекше түрін анықтайды: топтық поляризация (талқылаудан кейін топ мүшелерінің пікірі неғұрлым шеткі бағытқа ауысуы). Негізгі идея мынада: адамдар бір-бірімен сөйлескенде, көбінесе бастапқы бейімділіктеріне сәйкес келетін неғұрлым шеткі нүктеге тоқтайды. Мысалы, егер жеті адамнан тұратын топтың көпшілігі Парижде жаңа кеңсе ашу жақсы идея деп ойласа, талқылаудан кейін топ бұл кеңсені ашу керемет идея деген қорытындыға келуі мүмкін. Ішкі талқылаулар көбінесе үлкен сенімділікке, үлкен бірлікке және көбінесе артып келе жатқан құлшыныс түріндегі үлкен экстремизмге әкеледі. Топтық поляризация тек алқабилерде ғана емес; кәсіби пайымдаулар жасайтын командалар да көбінесе поляризацияланады.
Бірқатар эксперименттерде біз өнімнің жауапкершілігі туралы істерде жазалау өтемақысын тағайындайтын алқабилердің шешімдерін зерттедік. Әрбір алқабилер сотының шешімі — бұл компанияны жасаған қателігі үшін жазалауға және басқаларға сабақ болуға арналған ақшалай сома. (Біз бұл зерттеулерге оралып, оларды 15-тарауда толығырақ сипаттайтын боламыз). Біздің мақсатымыз үшін, мұнда шынайы әлемдегі ақылдасатын алқабилер мен «статистикалық алқабилерді» салыстыратын экспериментті қарастырыңыз. Біріншіден, біз зерттеуімізге қатысқан 899 адамға іс сценарийлерін ұсынып, олардан өздерінің ашу-ызасы мен жазалау ниетін білдіру үшін жеті дәрежелі шкаланы, ал ақшалай сыйақылар үшін доллар шкаласын (егер бар болса) пайдаланып, тәуелсіз пайымдаулар жасауды сұрадық. Содан кейін, компьютердің көмегімен біз осы жеке жауаптарды миллиондаған статистикалық алқабилерді, яғни виртуалды алты адамнан тұратын топтарды (кездейсоқ жиналған) жасау үшін пайдаландық. Әрбір статистикалық алқабилер тобында біз алты жеке пайымдаудың медианасын үкім ретінде алдық.
Біз бұл статистикалық алқабилердің пайымдаулары әлдеқайда дәйекті екенін анықтадық. Шу айтарлықтай азайды. Төмен шу — статистикалық біріктірудің механикалық әсері болды: тәуелсіз, жеке пайымдаулардағы шу оларды орташаландыру арқылы әрқашан азаяды.
Алайда, шынайы әлемдегі алқабилер статистикалық алқабилер емес; олар кездеседі және іс бойынша өз көзқарастарын талқылайды. Сіз ақылдасатын алқабилер шынымен де өздерінің орташа мүшелерінің пайымдауына келуге бейім бе деп ойлауыңыз мүмкін. Мұны анықтау үшін біз бірінші эксперименттен кейін тағы біреуін жүргіздік, оған үш мыңнан астам алқаби болуға құқылы азамат және бес жүзден астам алты адамнан тұратын алқабилер тобы қатысты.
Нәтижелер анық болды. Дәл сол істі қарастырғанда, ақылдасатын алқабилер статистикалық алқабилерге қарағанда әлдеқайда шулы болды — бұл әлеуметтік әсер шуының айқын көрінісі. Талқылау шуды арттыруға әсер етті.
Тағы бір қызықты тұжырым болды. Алты адамнан тұратын топтың орташа мүшесі орташа деңгейде ғана ашуланып, жұмсақ жазаны қолдағанда, ақылдасатын алқабилердің үкімі әдетте одан да жұмсақ болып шықты. Керісінше, алты адамнан тұратын топтың орташа мүшесі қатты ашуланып, қатаң жазалау ниетін білдіргенде, ақылдасатын алқабилер әдетте одан да қатты ашуланып, одан да қатаң шешімге келді. Ал бұл ашу-ыза ақшалай өтемақы ретінде көрсетілгенде, алқабилердің орташа мүшесі қолдаған сомадан жоғары ақшалай өтемақы тағайындауға жүйелі бейімділік байқалды. Шынында да, алқабилердің 27%-ы өздерінің ең қатал мүшесінің таңдауымен бірдей немесе одан да жоғары өтемақы таңдады. Ақылдасатын алқабилер статистикалық алқабилерге қарағанда шулы болып қана қоймай, сонымен қатар оларды құрайтын жеке адамдардың пікірлерін күшейтіп жіберді.
Топтық поляризацияның негізгі тұжырымын еске түсіріңіз: адамдар бір-бірімен сөйлескеннен кейін, олар әдетте бастапқы бейімділіктеріне сәйкес келетін неғұрлым шеткі нүктеге келеді. Біздің эксперимент осы әсерді көрсетеді. Ақылдасатын алқабилер (орташа мүшесі жұмсақ болғанда) үлкен жұмсақтыққа және (орташа мүшесі қатал болғанда) үлкен қаталдыққа ауысуды бастан кешірді. Сол сияқты, ақшалай жаза қолдануға бейім алқабилер өздерінің орташа мүшелері қолдағаннан да қатаң жазалар тағайындады.
Топтық поляризацияның түсіндірмелері, өз кезегінде, каскадтық әсерлердің түсіндірмелеріне ұқсас. Ақпарат маңызды рөл атқарады. Егер көптеген адамдар қатаң жазаны қолдаса, онда топ қатаң жазаны қолдайтын көптеген аргументтерді естиді — және керісінше аргументтер аз болады. Егер топ мүшелері бір-бірін тыңдаса, олар басым тенденция бағытына ауысып, топты біртұтас, сенімдірек және шеткі етеді. Егер адамдар топ ішіндегі өз беделіне мән берсе, олар басым тенденция бағытына ауысады, бұл да поляризацияны тудырады.
Топтық поляризация, әрине, қателіктер тудыруы мүмкін. Және ол жиі солай істейді. Бірақ біздің мұндағы негізгі назарымыз өзгермелілікте. Көріп отырғанымыздай, пайымдауларды біріктіру шуды азайтады және сол мақсаттар үшін пайымдаулар неғұрлым көп болса, соғұрлым жақсы. Міне, сондықтан статистикалық алқабилер жеке алқабилерге қарағанда азырақ шулы. Сонымен қатар, біз ақылдасатын алқабилердің статистикалық алқабилерден гөрі шулы екенін анықтадық. Ұқсас жағдайдағы топтардың әртүрлі нәтижелерге келуінің себебі көбінесе топтық поляризация болып табылады. Және нәтижесінде пайда болатын шу өте қатты болуы мүмкін.
Бизнесте, үкіметте және кез келген басқа жерде каскадтар мен поляризация бір мәселені қарастыратын топтар арасындағы үлкен алшақтыққа әкелуі мүмкін. Нәтижелердің бірнеше адамның — бірінші сөйлейтіндердің немесе ең үлкен ықпалы барлардың — пайымдауларына ықтимал тәуелділігі, жеке пайымдаулардың қаншалықты шулы болатынын зерттегеннен кейін ерекше алаңдаушылық тудыруы керек. Біз деңгейлік шу мен заңдылық шуы топ мүшелерінің пікірлері арасындағы айырмашылықтарды тиісті деңгейден (және біз күткеннен) үлкенірек ететінін көрдік. Сондай-ақ, жағдаяттық шу — шаршау, көңіл-күй, салыстыру нүктелері — бірінші сөйлеген адамның пайымдауына әсер етуі мүмкін екенін көрдік. Топтық динамика бұл шуды күшейте алады. Нәтижесінде, ақылдасатын топтар жеке пайымдауларды жай ғана орташаландыратын статистикалық топтарға қарағанда шулы болады.
Бизнес пен үкіметтегі көптеген маңызды шешімдер қандай да бір ақылдасу процесінен кейін қабылданатындықтан, бұл қауіпке сергек болу өте маңызды. Ұйымдар мен олардың басшылары өздерінің жеке мүшелерінің пайымдауларындағы шуды бақылау үшін шаралар қолдануы керек. Олар сондай-ақ ақылдасатын топтарды шуды күшейтпей, оны азайтатын жолмен басқаруы керек. Біз ұсынатын шуды азайту стратегиялары осы мақсатқа жетуге бағытталған.
«Бәрі ерте танымалдылыққа байланысты сияқты. Жаңа шығарылымымыздың бірінші аптасы тамаша өтуі үшін барымызды салғанымыз жөн».
«Мен әрқашан күдіктенгенімдей, саясат пен экономика туралы идеялар киножұлдыздарға өте ұқсас. Егер адамдар басқа адамдарға олар ұнайды деп ойласа, мұндай идеялар алысқа баруы мүмкін».
«Менің командам жиналғанда, біз сенімді әрі біртұтас болатынымызға — және таңдаған іс-қимыл бағытымызға берік болатынымызға әрқашан алаңдайтынмын. Біздің ішкі процестерімізде бірдеңе дұрыс емес сияқты! »
III БӨЛІМ Болжамдық пайымдаулардағы шу
Көптеген пайымдаулар — бұл болжамдар, ал тексерілетін болжамдарды бағалауға болатындықтан, біз оларды зерттеу арқылы шу мен бұрмалану туралы көп нәрсені біле аламыз. Кітаптың бұл бөлімінде біз болжамдық пайымдауларға назар аударамыз.
9-тарауда кәсіби мамандар, машиналар және қарапайым ережелер жасаған болжамдардың дәлдігі салыстырылады. Бұл бәсекеде кәсіби мамандардың үшінші орынға ие болғанына таң қалмайсыз. 10-тарауда біз осы нәтиженің себептерін зерттейміз және шу адам пайымдауының төмендігінің негізгі факторы екенін көрсетеміз.
Бұл тұжырымдарға жету үшін біз болжамдардың сапасын бағалауымыз керек, ал ол үшін бізге болжамдық дәлдік өлшемі, яғни мына сұраққа жауап беру тәсілі қажет: Болжамдар нәтижелермен қаншалықты ковариацияланады (бірге өзгереді)? Мысалы, егер HR департаменті жаңа қызметкерлердің әлеуетін үнемі бағалап отырса, біз қызметкерлердің қалай жұмыс істейтінін білу үшін бірнеше жыл күтіп, әлеуетті бағалаудың жұмыс нәтижелерін бағалаумен қаншалықты ковариацияланатынын көре аламыз. Болжамдар жұмысқа қабылданған кезде әлеуеті жоғары деп бағаланған қызметкерлердің өз жұмыстары үшін де жоғары баға алу дәрежесіне қарай дәл болады.
Осы интуицияны көрсететін өлшем — сәйкестік пайызы (PC) , ол нақтырақ сұраққа жауап береді: Кездейсоқ алынған екі қызметкерді елестетіңіз. Әлеуетті бағалауда жоғары ұпай жинаған адамның жұмыста да жақсы нәтиже көрсету ықтималдығы қандай? Егер ерте бағалаудың дәлдігі мінсіз болса, PC 100% болар еді: екі қызметкердің әлеуеті бойынша рейтингі олардың жұмыс нәтижелері бойынша соңғы рейтингінің мінсіз болжамы болар еді. Егер болжамдар мүлдем пайдасыз болса, сәйкестік тек кездейсоқтықпен ғана орын алар еді және «жоғары әлеуетті» қызметкердің жақсы нәтиже көрсету ықтималдығы 50/50 болар еді: PC 50% болады. Біз кеңінен зерттелген бұл мысалды 9-тарауда талқылаймыз. Қарапайым мысал келтірсек, ересек ер адамдардың аяқ киім өлшемі мен бойының PC көрсеткіші 71%-ды құрайды. Егер сіз екі адамға, алдымен олардың басына, сосын аяқтарына қарасаңыз, бойы ұзынырақ адамның аяғы да үлкенірек болу ықтималдығы 71% құрайды.
PC — ковариацияның интуитивті түсінікті өлшемі, бұл оның үлкен артықшылығы, бірақ ол әлеуметтік ғалымдар қолданатын стандартты өлшем емес. Стандартты өлшем — корреляция коэффициенті (r) , ол екі айнымалы оң байланыста болғанда 0 мен 1 арасында өзгереді. Алдыңғы мысалда бой мен аяқ өлшемі арасындағы корреляция шамамен . 60 құрайды.
Корреляция коэффициенті туралы ойлаудың көптеген жолдары бар. Соның ішінде ең интуитивті түрі мынау: екі айнымалының арасындағы корреляция — бұл олардың ортақ детерминанттарының (анықтаушы факторларының) пайызы. Мысалы, қандай де бір қасиет толығымен генетикалық түрде анықталады деп елестетіңіз. Онда біз гендерінің 50%-ы ортақ туған бауырлар арасында осы қасиет бойынша 0,50 корреляцияны, ал гендерінің 25%-ы ортақ бөлелер (бірінші буын кузендер) арасында 0,25 корреляцияны күтер едік. Сондай-ақ бой ұзындығы мен аяқ киім өлшемі арасындағы 0,60 корреляцияны — бойды анықтайтын себептік факторлардың 60%-ы аяқ киім өлшемін де анықтайтынын білдіреді деп түсінуге болады.
Біз сипаттаған ковариацияның (екі шаманың бірлескен өзгерісі) екі өлшемі бір-бірімен тікелей байланысты. 1-кестеде корреляция коэффициентінің әртүрлі мәндері үшін PC (Percentage Concordant — конкорданттық пайызы: екі жағдайды салыстырғанда болжамның сәйкес келу ықтималдығы) көрсетілген. Осы кітаптың қалған бөлігінде біз адамдар мен модельдердің тиімділігін талқылағанда, әрқашан осы екі өлшемді бірге ұсынамыз.
1-кесте: Корреляция коэффициенті және конкорданттық пайызы (PC)
Корреляция коэффициенті: . 00 Конкорданттық пайызы (PC): 50%
Корреляция коэффициенті: . 10 Конкорданттық пайызы (PC): 53%
Корреляция коэффициенті: . 20 Конкорданттық пайызы (PC): 56%
Корреляция коэффициенті: . 30 Конкорданттық пайызы (PC): 60%
Корреляция коэффициенті: . 40 Конкорданттық пайызы (PC): 63%
Корреляция коэффициенті: . 60 Конкорданттық пайызы (PC): 71%
Корреляция коэффициенті: . 80 Конкорданттық пайызы (PC): 79%
Корреляция коэффициенті: 1. 00 Конкорданттық пайызы (PC): 100%
11-тарауда біз болжам дәлдігінің маңызды шегін талқылаймыз: көптеген пайымдаулар біз объективті бейхабарлық (болашаққа әсер ететін факторлардың мүлдем белгісіз болуы) деп атайтын күйде жасалады, өйткені болашақ тәуелді болатын көптеген нәрселерді білу мүмкін емес. Таңқаларлығы, біз көп жағдайда бұл шектеуді байқамай, болжамдарды нық сеніммен (немесе тіпті асыра сенімділікпен) жасаймыз. Соңында, 12-тарауда біз объективті бейхабарлық тек оқиғаларды болжау қабілетімізге ғана емес, тіпті оларды түсіну қабілетімізге де қалай әсер ететінін көрсетеміз — бұл шудың неліктен көрінбейтіндігі туралы жұмбақтың маңызды жауабы.
9-ТАРАУ Пайымдаулар мен модельдер
Көптеген адамдарды адамдардың болашақ жұмыс өнімділігін — өздерінің және басқалардың — болжау қызықтырады. Сондықтан өнімділікті болжау кәсіби болжамдық пайымдаудың пайдалы мысалы болып табылады. Мысалы, ірі компаниядағы екі басқарушыны қарастырайық. Моника мен Натали жұмысқа қабылданған кезде мамандандырылған консалтингтік фирма тарапынан бағаланып, көшбасшылық, коммуникация, тұлғааралық дағдылар, жұмысқа қатысты техникалық дағдылар және келесі лауазымға деген мотивация бойынша 1-ден 10-ға дейінгі шкаламен ұпайлар алды (2-кесте). Сіздің міндетіңіз — олардың жұмысқа орналасқаннан кейін екі жыл өткендегі өнімділігін 1-ден 10-ға дейінгі шкала бойынша болжау.
2-кесте: Басқарушы лауазымына екі кандидат
Моника Көшбасшылық: 4 Коммуникация: 6 Тұлғааралық дағдылар: 4 Техникалық дағдылар: 8 Мотивация: 8 Сіздің болжамыңыз: ____
Натали Көшбасшылық: 8 Коммуникация: 10 Тұлғааралық дағдылар: 6 Техникалық дағдылар: 7 Мотивация: 6 Сіздің болжамыңыз: ____
Мұндай мәселеге тап болған адамдардың көбі әр жолға көз жүгіртіп, кейде ұпайлардың орташа мәнін ойша есептеп, тез шешім шығарады. Егер сіз солай жасаған болсаңыз, Натали мықтырақ кандидат және оның Моникадан айырмашылығы 1 немесе 2 ұпай деп қорытынды жасаған боларсыз.
Пайымдау ма әлде формула ма?
Сіздің бұл мәселеге деген бейресми көзқарасыңыз клиникалық пайымдау (интуиция мен тәжірибеге негізделген бейресми шешім қабылдау процесі) деп аталады. Сіз ақпаратты қарастырасыз, мүмкін тез арада есептеулер жүргізесіз, түйсігіңізге сүйенесіз және шешім қабылдайсыз. Шын мәнінде, клиникалық пайымдау — бұл біз осы кітапта жай ғана «пайымдау» деп атаған процесс.
Енді сіз болжау тапсырмасын экспериментке қатысушы ретінде орындадыңыз деп есептейік. Моника мен Натали бірнеше жыл бұрын жұмысқа алынған және бес бөлек өлшем бойынша бағаланған бірнеше жүз менеджерлердің дерекқорынан алынған. Сіз осы бағалауларды менеджерлердің жұмыстағы табысын болжау үшін пайдаландыңыз. Енді олардың жаңа рөлдеріндегі өнімділігі туралы бағалаулар қолжетімді болды. Бұл бағалаулар сіздің олардың әлеуеті туралы клиникалық пайымдауларыңызбен қаншалықты сәйкес келеді?
Бұл мысал өнімділікті болжаудың нақты зерттеуіне негізделген. Егер сіз сол зерттеуге қатысқан болсаңыз, оның нәтижелеріне риза болмас едіңіз. Халықаралық консалтингтік фирмада осындай болжамдар жасау үшін жұмыс істейтін докторлық деңгейдегі психологтар өнімділікті бағалаумен 0,15 корреляцияға (PC = 55%) қол жеткізді. Басқаша айтқанда, олар бір кандидатты екіншісінен мықтырақ деп бағалағанда — сіз Моника мен Наталиге жасағандай — олардың таңдаған кандидатының өнімділігі жоғары болып шығу ықтималдығы 55% болды, бұл кездейсоқтықтан сәл ғана жақсы. Бұл өте төмен нәтиже екенін айта кеткен жөн.
Мүмкін сіз дәлдіктің төмендігін көрсетілген бағалаулардың болжау үшін пайдасыз болғандығынан деп ойлайтын шығарсыз. Сондықтан біз сұрауымыз керек: кандидаттардың рейтингтерінде іс жүзінде қаншалықты пайдалы болжамдық ақпарат бар? Болжам мен нәтиже арасындағы ең жоғары корреляцияны алу үшін оларды қалай біріктіруге болады?
Стандартты статистикалық әдіс бұл сұрақтарға жауап береді. Қарастырылып отырған зерттеуде ол 0,32 (PC = 60%) деңгейіндегі оңтайлы корреляцияны береді. Бұл да өте жоғары емес, бірақ клиникалық болжамдардан айтарлықтай жоғары.
Көптік регрессия (бірнеше көрсеткіш негізінде нәтижені болжайтын статистикалық әдіс) деп аталатын бұл техника болжамдық ұпайды предикторардың салмақталған орташа мәні ретінде есептейді. Ол құрамдас болжам мен мақсатты айнымалы арасындағы корреляцияны максималды түрде арттыру үшін салмақтардың оңтайлы жиынтығын табады. Оңтайлы салмақтар болжамдардың MSE-ін (Mean Squared Error — орташа квадраттық қате: болжам мен нақты мән арасындағы ауытқуды өлшейтін көрсеткіш) азайтады — бұл статистикадағы ең кіші квадраттар принципінің басым рөлінің жарқын мысалы. Күткеніңіздей, мақсатты айнымалымен тығыз байланысты предиктор үлкен салмақ алады, ал пайдасыз предикторлар нөлдік салмаққа ие болады. Салмақтар теріс те болуы мүмкін: мысалы, кандидаттың төленбеген жол жүру айыппұлдарының саны басқарушылық табыстың предикторы ретінде теріс салмақ алуы ықтимал.
Көптік регрессияны пайдалану — механикалық болжамның (белгілі бір алгоритм немесе формула арқылы жасалатын есептеу) бір мысалы. Механикалық болжамның қарапайым ережелерден («орта мектепті бітірген кез келген адамды жұмысқа алу») күрделі жасанды интеллект модельдеріне дейінгі көптеген түрлері бар. Бірақ сызықтық регрессия модельдері ең көп таралған («пайымдау мен шешім қабылдау зерттеулерінің жұмыс аты» деп аталған). Терминологияны жеңілдету үшін біз сызықтық модельдерді «қарапайым модельдер» деп атаймыз.
Моника мен Натали мысалында көрсетілген зерттеу клиникалық және механикалық болжамдарды салыстырудың көптеген мысалдарының бірі болды, олардың барлығы қарапайым құрылымға ие:
 Предиктор айнымалылар жиынтығы (біздің мысалда — кандидаттардың рейтингтері) мақсатты нәтижені (сол адамдардың жұмыс өнімділігін) болжау үшін қолданылады;)
 Адам-сарапшылар клиникалық болжамдар жасайды;)
 Ереже (мысалы, көптік регрессия) дәл сол нәтижелердің механикалық болжамдарын шығару үшін дәл сол предикторларды қолданады;)
 Клиникалық және механикалық болжамдардың жалпы дәлдігі салыстырылады.)
Мил: Оңтайлы модель сізді жеңеді
Адамдар клиникалық және механикалық болжаммен танысқанда, олар екеуінің қалай салыстырылатынын білгісі келеді. Адамның пайымдауы формуламен салыстырғанда қаншалықты жақсы?
Бұл сұрақ бұрын да қойылған, бірақ ол 1954 жылы Миннесота университетінің психология профессоры Пол Мил «Клиникалық және статистикалық болжам: теориялық талдау және дәлелдемелерге шолу» атты кітабын шығарғанда ғана үлкен назар аудартты. Мил академиялық табыс және психиатриялық болжам сияқты нәтижелер бойынша клиникалық пайымдау механикалық болжамға қарсы қойылған жиырма зерттеуді қарап шықты. Ол қарапайым механикалық ережелер әдетте адам пайымдауынан басым болады деген нық тұжырымға келді. Мил клиницистер мен басқа да мамандар өздерінің бірегей күші деп санайтын ақпаратты біріктіру қабілетінде өте әлсіз екенін анықтады.
Бұл тұжырымның қаншалықты таңқаларлық екенін және оның шумен қалай байланысты екенін түсіну үшін қарапайым механикалық болжам моделінің қалай жұмыс істейтінін түсіну керек. Оның негізгі сипаттамасы — барлық жағдайларға бірдей ереже қолданылады. Әрбір предиктордың салмағы бар және ол салмақ бір жағдайдан екіншісіне өзгермейді. Сіз бұл қатаң шектеу модельдерді адам-сарапшылармен салыстырғанда үлкен тиімсіздікке ұшыратады деп ойлауыңыз мүмкін. Біздің мысалда, мүмкін сіз Мониканың мотивациясы мен техникалық дағдыларының үйлесімі маңызды артықшылық болады және оның басқа салалардағы кемшіліктерін толтырады деп ойлаған шығарсыз. Және Наталидің осы екі саладағы әлсіздігі оның басқа күшті жақтарын ескергенде маңызды емес деп шешкен боларсыз. Саналы түрде болмаса да, сіз екі әйел үшін табысқа жетудің әртүрлі жолдарын елестеттіңіз. Бұл клиникалық болжамдар іс жүзінде екі жағдайда бірдей предикторларға әртүрлі салмақ береді — бұл қарапайым модельдің қолынан келмейтін нәзіктік.
Қарапайым модельдің тағы бір шектеуі — предиктордың 1 бірлікке артуы әрқашан бірдей әсер береді (және 2 бірлікке артудың жартысындай әсер етеді). Клиникалық түйсік бұл ережені жиі бұзады. Мысалы, егер сізге Наталидің коммуникация дағдылары бойынша алған мінсіз 10 ұпайы әсер етіп, бұл ұпай сіздің болжамыңызды күшейтуге тұрарлық деп шешсеңіз, сіз қарапайым модель жасамайтын нәрсені жасадыңыз. Салмақталған орташа формуласында 10 мен 9 ұпайдың арасындағы айырмашылық 7 мен 6 арасындағы айырмашылықпен бірдей болуы тиіс. Клиникалық пайымдау бұл ережеге бағынбайды. Оның орнына, ол бір контексте маңызды емес айырмашылық басқа контексте шешуші болуы мүмкін деген ортақ интуицияны көрсетеді. Біз ешқандай қарапайым модель сіздің Моника мен Натали туралы пайымдауларыңызды дәл қайталай алмайды деп ойлаймыз.
Бұл жағдайлар үшін біз қолданған зерттеу Милдің заңдылығының айқын мысалы болды. Жоғарыда айтылғандай, клиникалық болжамдар жұмыс өнімділігімен 0,15 корреляцияға (PC = 55%) қол жеткізсе, механикалық болжам 0,32 корреляцияға (PC = 60%) қол жеткізді. Моника мен Натали жағдайларының салыстырмалы артықшылықтары туралы сезінген сенімділігіңізді ойлаңыз. Милдің нәтижелері сіздің пайымдауыңыздың сапасына қатысты кез келген қанағаттану сезіміңіз иллюзия болғанын айқын көрсетеді: бұл валидтілік иллюзиясы (өз болжамының дәлдігіне негізсіз сенімділік).
Валидтілік иллюзиясы болжамдық пайымдаулар жасалатын кез келген жерде кездеседі, өйткені болжау тапсырмасының екі кезеңін ажырата алмау жиі кездеседі: қолда бар дәлелдер негізінде жағдайларды бағалау және нақты нәтижелерді болжау. Сіз екі кандидаттың қайсысы жақсырақ көрінетінін бағалауда өте сенімді бола аласыз, бірақ олардың қайсысы іс жүзінде жақсырақ болатынын болжау — мүлдем басқа мәселе. Мысалы, Натали Моникадан мықтырақ кандидат болып көрінеді деп сеніммен айтуға болады, бірақ Натали Моникадан табыстырақ басқарушы болады деп нық айту мүмкін емес. Себебі қарапайым: сіз екі жағдайды бағалау үшін қажетті нәрсенің көбін білесіз, бірақ болашаққа көз жүгірту — өте белгісіз нәрсе.
Өкінішке орай, бұл айырмашылық біздің ойлауымызда жоғалып кетеді. Егер сіз жағдайларды бағалау мен болжамдарды ажыратуда шатассаңыз, сіз жалғыз емессіз: мұны бәрі де шатастырады. Алайда, егер сіз өз болжамдарыңызға жағдайларды бағалаудағыдай сенімді болсаңыз, онда сіз валидтілік иллюзиясының құрбанысыз.
Клиницистер де валидтілік иллюзиясынан ада емес. Психологтардың Милдің «тұрақты қолданылатын қарапайым формулалар клиникалық пайымдаудан асып түседі» деген тұжырымына реакциясын елестетуге болады. Бұл реакция шок, сенімсіздік және клиникалық түйсіктің кереметтерін зерттеуге тырысқан «таяз» зерттеулерге деген менсінбеушіліктің қоспасы болды. Бұл реакцияны түсіну оңай: Милдің заңдылығы пайымдаудың субъективті тәжірибесіне қайшы келеді, ал көбіміз ғалымның айтқанынан қарағанда өз тәжірибемізге көбірек сенеміз.
Милдің өзі де өз тұжырымдарына екіұдай қарады. Оның есімі статистиканың клиникалық пайымдаудан басымдығымен байланысты болғандықтан, біз оны адамның ішкі түйсігін аяусыз сынаушы немесе қазіргі тілмен айтқанда «кванттардың» (сандық талдаушылардың) атасы ретінде елестетуіміз мүмкін. Бірақ бұл тек карикатура болар еді. Мил академиялық мансабынан бөлек, практик психоаналитик болды. Оның кабинетінде Фрейдтің суреті ілулі тұратын. Ол тек психологиядан ғана емес, философия мен құқықтан да дәріс берген, метафизика, дін, саясаттану, тіпті парапсихология туралы жазған энциклопедист-ғалым еді. (Ол «телепатияда бір нәрсе бар» деп табандылық танытқан). Бұл сипаттардың ешқайсысы қатал сандар маманының стереотипіне сәйкес келмейді. Мил клиницистерге жамандық тілеген жоқ — керісінше. Бірақ ол айтқандай, мәліметтерді біріктірудегі механикалық тәсілдің артықшылығы туралы дәлелдер «ауқымды және тұрақты» болды.
«Ауқымды және тұрақты» — бұл әділ сипаттама. 2000 жылы 136 зерттеуге жасалған шолу механикалық агрегацияның клиникалық пайымдаудан басым екенін біржола растады. Мақалада қарастырылған зерттеулер сарғаю диагнозын қою, әскери қызметке жарамдылық және некедегі қанағаттанушылық сияқты көптеген тақырыптарды қамтыды. 63 зерттеуде механикалық болжам дәлірек болды, тағы 65-інде статистикалық теңдік жарияланды, ал 8 жағдайда ғана клиникалық пайымдау жеңіске жетті. Бұл нәтижелер механикалық болжамның артықшылықтарын тіпті төмендетіп көрсетеді, өйткені ол клиникалық пайымдауға қарағанда тезірек әрі арзанырақ. Сонымен қатар, көптеген зерттеулерде адамдарға компьютерлік модельге берілмеген «жеке» ақпаратқа қол жеткізу мүмкіндігі берілгендіктен, олардың әділетсіз басымдығы болды. Нәтижелер қатал қорытындыны қолдайды: қарапайым модельдер адамдарды жеңеді.
Голдберг: Сіздің моделіңіз сізді жеңеді
Милдің тұжырымы маңызды сұрақтар туғызады. Неліктен формула басым? Формула нені жақсырақ істейді? Негізінде, адамдардың нені нашар істейтінін сұраған дұрысырақ болар еді. Жауап: адамдар статистикалық модельдерден көп жағынан төмен. Олардың басты кемшіліктерінің бірі — олардың шулы (тұрақсыз) болуы.
Бұл қорытындыны қолдау үшін біз Орегон штатындағы шағын Юджин қаласында басталған қарапайым модельдер туралы зерттеулердің басқа ағымына жүгінеміз. Пол Хоффман академиялық ортаның баяулығына шыдамаған дәулетті әрі көреген психолог болды. Ол ғылыми-зерттеу институтын құрып, Юджинді адам пайымдауын зерттеудің әлемге әйгілі орталығына айналдырған бірнеше ерекше тиімді зерттеушілерді бір шаңырақ астына жинады.
Осы зерттеушілердің бірі — Льюис Голдберг, ол тұлғаның «Үлкен бестік» моделін жасаудағы жетекші рөлімен танымал. 1960 жылдардың соңында Голдберг жеке адамның пайымдауларын сипаттайтын статистикалық модельдерді зерттеді.
Шындық моделін құру сияқты, сарапшының моделін құру да оңай. Ол үшін де дәл сол предикторлар қолданылады. Біздің бастапқы мысалымызда предикторлар — бұл менеджердің өнімділігінің бес рейтингі. Сондай-ақ дәл сол құрал — көптік регрессия қолданылады. Жалғыз айырмашылық — мақсатты айнымалыда. Нақты нәтижелерді болжаудың орнына, формула пайымдаулар жиынтығын болжау үшін қолданылады — мысалы, сіздің Моника, Натали және басқа менеджерлер туралы пайымдауларыңызды.
Сіздің пайымдауларыңызды салмақталған орташа мән ретінде модельдеу идеясы мүлдем оғаш көрінуі мүмкін, өйткені сіз өз пікіріңізді олай қалыптастырмайсыз. Моника мен Натали туралы клиникалық түрде ойланғанда, сіз екі жағдайға да бірдей ережені қолданған жоқсыз. Шын мәнінде, сіз ешқандай ереже қолданған жоқсыз. Сарапшының моделі — бұл сарапшының іс жүзінде қалай пайымдайтынын шынайы сипаттау емес.
Алайда, сіз сызықтық формуланы іс жүзінде есептемесеңіз де, пайымдауларыңызды соны қолданғандай жасай аласыз. Бильярдтың кәсіби ойыншылары соққының механикасын сипаттайтын күрделі теңдеулерді шешіп жатқандай әрекет етеді, тіпті олар іс жүзінде ондай ештеңе істеп жатпаса да. Сол сияқты, сіз іс жүзінде әлдеқайда күрделі нәрсе жасасаңыз да, болжамдарды қарапайым формуланы қолданғандай шығара аласыз. Адамдардың не істейтінін ақылға қонымды дәлдікпен болжайтын «солай болғандай» (as-if) моделі, тіпті ол процесті сипаттау ретінде қате болса да пайдалы. Пайымдаудың қарапайым модельдеріне қатысты жағдай осындай. Пайымдауларды зерттеуге жасалған ауқымды шолу 237 зерттеуде сарапшының моделі мен сарапшының клиникалық пайымдаулары арасындағы орташа корреляция 0,80 (PC = 79%) болғанын анықтады. Бұл мінсіз болмаса да, «солай болғандай» теориясын қолдау үшін жеткілікті жоғары көрсеткіш.
Голдбергтің зерттеуіне түрткі болған сұрақ — сарапшының қарапайым моделі нақты нәтижелерді қаншалықты жақсы болжай алады? Модель сарапшының дөрекі жуықтауы болғандықтан, ол соншалықты жақсы нәтиже көрсете алмайды деп пайымдау қисынды. Модель сарапшыны алмастырғанда дәлдік қаншалықты жоғалады?
Жауап сізді таң қалдыруы мүмкін. Модель болжамдар жасағанда дәлдік жоғалған жоқ. Ол жақсарды. Көп жағдайда модель өзі негізделген маманның өзінен де дәлірек болжам жасады. Көшірме түпнұсқадан жақсырақ болып шықты.
Бұл қорытынды көптеген салалардағы зерттеулермен расталды. Голдберг жұмысының ерте қайталануы магистратурадағы табысты болжауға қатысты болды. Зерттеушілер 98 қатысушыдан он көрсеткіш негізінде 90 студенттің орташа балын (GPA) болжауды сұрады. Осы болжамдар негізінде зерттеушілер әрбір қатысушының пайымдауларының сызықтық моделін құрды және қатысушылар мен олардың модельдерінің GPA-ды қаншалықты дәл болжағанын салыстырды. Барлық 98 қатысушы үшін модель қатысушының өзінен жақсырақ нәтиже көрсетті! Ондаған жылдар өткен соң, елу жылдық зерттеулерге жасалған шолу сарапшылардың модельдері олар модельдеген сарапшылардан үнемі асып түсетінін растады.
Біз бұл зерттеулерге қатысушылардың өз нәтижелері туралы жеке кері байланыс алғанын білмейміз. Бірақ егер біреу сізге сіздің пайымдауларыңыздың қарабайыр моделі — тіпті карикатурасы — сізден де дәлірек екенін айтса, қаншалықты таң қалатыныңызды елестетуге болады. Көбіміз үшін пайымдау әрекеті күрделі, бай және қызықты, себебі ол қарапайым ережелерге бағынбайды. Біз күрделі ережелерді ойлап тауып қолданғанда немесе жеке жағдайды басқалардан ерекшелейтін ішкі түйсікке ие болғанда өзімізді және пайымдау қабілетімізді жоғары бағалаймыз. Қысқасы, біз пайымдауларды қарапайым салмақталған орташа есептеуге келтіру мүмкін емес деп санағанды ұнатамыз. Сарапшы-моделі зерттеулері Милдің «нәзіктік көбіне босқа кетеді» деген тұжырымын нығайта түседі. Күрделілік пен байлық әдетте дәлірек болжамдарға әкелмейді.
Бұл неліктен солай?
Голдбергтің тұжырымын түсіну үшін сіз бен сіздің моделіңіз арасындағы айырмашылықтардың себебін түсінуіміз керек. Сіздің нақты пайымдауларыңыз бен оларды болжайтын қарапайым модельдің нәтижелері арасындағы сәйкессіздіктерге не себеп болады?
Сіздің пайымдауларыңыздың статистикалық моделі оларда бар ақпаратқа ештеңе қоса алмайды. Модельдің бар қолынан келетіні — алып тастау және жеңілдету. Соның ішінде, сіздің пайымдауларыңыздың қарапайым моделі сіз тұрақты түрде ұстанатын ешқандай күрделі ережелерді көрсетпейді. Егер сіз коммуникация дағдыларының рейтингіндегі 10 мен 9 арасындағы айырмашылық 7 мен 6 арасындағыдан маңыздырақ деп ойласаңыз немесе барлық өлшемдер бойынша тұрақты 7 алған жан-жақты кандидатты айқын күшті және әлсіз жақтары бар, бірақ орташа балы сондай кандидаттан артық көрсеңіз — сіздің моделіңіз бұл күрделі ережелерді қайталамайды, тіпті сіз оларды мінсіз тұрақтылықпен қолдансаңыз да.
Сіздің нәзік ережелеріңізді қайталай алмау, сол нәзіктік шынымен маңызды болған сәттерде дәлдіктің жоғалуына әкеледі. Мысалы, сіз қиын тапсырмадағы сәттілікті екі көрсеткіш — дағды мен мотивация арқылы болжауыңыз керек делік. Мұнда салмақталған орташа мән жақсы формула болмайды, өйткені мотивацияның ешқандай мөлшері дағдының мүлдем жоқтығын өтей алмайды және керісінше. Егер сіз осы екі көрсеткіштің күрделірек комбинациясын қолдансаңыз, болжамыңыздың дәлдігі артады және бұл нәзіктікті ескере алмайтын модельден жоғары болады. Екінші жағынан, күрделі ережелер көбінесе сізге тек валидтілік елесін беріп, іс жүзінде пайымдауларыңыздың сапасына нұқсан келтіреді. Кейбір нәзік тұстар маңызды болғанымен, көбісі олай емес.
Сонымен қатар, сіздің қарапайым моделіңіз пайымдауларыңыздағы патерндік шуды (шешім қабылдаушының белгілі бір жағдайға деген жеке реакциясынан туындайтын қателіктер) көрсете алмайды. Ол нақты бір жағдайға қатысты ерікті реакцияларыңыздан туындайтын оң және теріс қателіктерді қайталай алмайды. Модель сондай-ақ сіз шешім қабылдаған сәттегі контекстің немесе ментальды күйіңіздің әсерін де қамтымайды. Сірә, пайымдаулардағы бұл шулы қателіктер ештеңемен жүйелі түрде байланыспаған, яғни көп жағдайда оларды кездейсоқ деп санауға болады.
Пайымдауларыңыздан шуды алып тастау әрқашан болжам дәлдігінің жақсаруына әкеледі. Мысалы, сіздің болжамдарыңыз бен нәтиже арасындағы корреляция . 50 (PC = 67%) болсын, бірақ пайымдауларыңыздың дисперсиясының 50%-ы шудан тұрады делік. Егер сіздің пайымдауларыңыз — сіздің моделіңіз сияқты — шусыз болса, олардың дәл сол нәтижемен корреляциясы . 71-ге (PC = 75%) дейін көтерілер еді. Шуды азайту механикалық түрде болжамдық пайымдаудың валидтілігін арттырады.
Қысқасы, сізді өзіңіздің моделіңізбен алмастыру екі нәрсені істейді: ол сіздің нәзік түйсігіңізді жояды және патерндік шуыңызды жояды. Судьяның моделі судьяның өзінен гөрі валидтірек деген тұжырым маңызды хабарлама береді: адам пайымдауындағы нәзік ережелерден келетін пайда — егер ол бар болса — әдетте шудың зиянды әсерін өтеуге жеткіліксіз. Сіз өзіңізді ойлау жүйеңіздің сызықтық карикатурасынан (күрделі ойлауды бейнелейтін тым қарапайым схема) гөрі нәзік, түсінігі терең әрі жан-жақты деп сенуіңіз мүмкін. Бірақ іс жүзінде сіз көбіне тек «шулырақсыз».
Неліктен болжамның күрделі ережелері валидті түсініктерге негізделгендей көрінгенімен, дәлдікке зиян тигізеді? Біріншіден, адамдар ойлап тапқан көптеген күрделі ережелер жалпы алғанда шындыққа жанаспайды. Бірақ тағы бір мәселе бар: тіпті күрделі ережелер принципті түрде дұрыс болса да, олар сирек кездесетін жағдайларда ғана қолданылады. Мысалы, сіз «ерекше креативті үміткерлерді, тіпті басқа көрсеткіштері орташа болса да, жұмысқа алу керек» деген қорытындыға келдіңіз делік. Мәселе мынада: ерекше креативті үміткерлер, анықтамасы бойынша, өте сирек кездеседі. Креативтілікті бағалау сенімсіз болуы мүмкін болғандықтан, бұл метрика бойынша көптеген жоғары ұпайлар жай ғана сәттілік болуы мүмкін, ал шынайы креативті таланттар көбіне байқалмай қалады. «Креативтілердің» супержұлдызға айналатынын растайтын жұмыс нәтижесін бағалау да мінсіз емес. Екі жақтан да өлшеу қателіктері болжамдардың валидтілігін сөзсіз төмендетеді, ал сирек оқиғалар көбіне назардан тыс қалады. Шынайы нәзіктіктің артықшылықтары өлшеу қателіктерінің ішінде тез батып кетеді.
Мартин Ю мен Натан Кунцелдің зерттеуі Голдберг демонстрациясының түбегейлі нұсқасын көрсетті. Бұл зерттеу (Моника мен Натали мысалына негіз болған) 847 үміткерді басқарушы лауазымдарға бағалау үшін сарапшыларды жалдаған халықаралық консалтингтік компанияның деректерін қолданды. Сарапшылар нәтижелерді жеті түрлі бағалау өлшемі бойынша бағалап, әрқайсысына жалпы болжамдық ұпай беру үшін өздерінің клиникалық пайымдауларын (маманның интуиция мен тәжірибеге сүйеніп жасайтын субъективті бағалауы) қолданды, бірақ нәтижелер аса әсерлі болмады.
Ю мен Кунцел судьяларды өздерінің ең жақсы қарапайым моделімен емес, кездейсоқ сызықтық модельмен салыстыруды жөн көрді. Олар жеті болжаушы үшін он мың кездейсоқ салмақ жиынтығын жасап, жұмыс нәтижесін болжау үшін осы он мың кездейсоқ формуланы қолданды.
Олардың таңғаларлық тұжырымы мынадай болды: кез келген сызықтық модель, егер ол барлық жағдайларға бірдей қолданылса, бірдей ақпарат негізінде нәтижені болжауда адам-сарапшылардан асып түсуі ықтимал. Үш үлгінің бірінде он мың кездейсоқ салмақталған сызықтық модельдің 77%-ы адам-сарапшылардан жақсырақ нәтиже көрсетті. Қалған екі үлгіде кездейсоқ модельдердің 100%-ы адамдардан асып түсті. Немесе ашығын айтқанда, бұл зерттеуде сарапшылардан нашар жұмыс істейтін қарапайым модель жасау мүмкін емес болып шықты.
Бұл зерттеудің қорытындысы Голдбергтің судья моделі туралы жұмысынан алған қорытындымыздан да күштірек және бұл шынымен де экстремалды мысал. Бұл жағдайда адам-судьялар абсолюттік мәнде өте нашар нәтиже көрсетті, бұл тіпті қарапайым сызықтық модельдердің олардан неліктен озып кеткенін түсіндіруге көмектеседі. Әрине, кез келген модель кез келген адамды жеңеді деген қорытынды шығармауымыз керек. Дегенмен, қарапайым ережені механикалық түрде сақтау (Ю мен Кунцел оны «ойланбастан бірізділік» деп атайды) күрделі мәселеде пайымдауды айтарлықтай жақсарта алатыны — клиникалық болжамдардың валидтілігіне шудың тигізетін орасан зор әсерін көрсетеді.
Бұл қысқаша шолу шудың клиникалық пайымдауды қалай нашарлататынын көрсетті. Болжамдық пайымдауларда қарапайым формулалар — шындық модельдері, судья модельдері немесе тіпті кездейсоқ жасалған модельдер — адам сарапшыларын оңай басып озады. Бұл тұжырым шусыз әдістерді: ережелер мен алгоритмдерді қолдануды жақтайды, бұл келесі тараудың тақырыбы болмақ.
Пайымдаулар мен модельдер туралы
«Адамдар шешім қабылдағанда күрделілікті қамтып, нәзік түйсік қосамыз деп сенеді. Бірақ бұл күрделілік пен нәзіктік көбіне зая кетеді — әдетте олар қарапайым модельдердің дәлдігін арттырмайды».
«Пол Милдің кітабы жарық көргеннен кейін алпыс жылдан астам уақыт өтсе де, механикалық болжамның адамнан жоғары екендігі туралы идея әлі де таңғаларлық болып қала береді».
«Пайымдауда шудың көптігі соншалық, судьяның шусыз моделі судьяның өзіне қарағанда дәлірек болжамдарға қол жеткізеді».
10-ТАРАУ Шусыз ережелер
Жақында жасанды интеллект (AI), әсіресе машиналық оқыту технологиялары, машиналарға бұрын тек адамға тән деп саналған көптеген тапсырмаларды орындауға мүмкіндік берді. Машиналық оқыту алгоритмдері бет-әлпетті тани алады, тілдерді аударады және радиологиялық суреттерді оқиды. Олар мыңдаған жүргізушілерге бір уақытта қозғалыс бағыттарын жасау сияқты есептеу мәселелерін таңғаларлық жылдамдықпен және дәлдікпен шеше алады. Сондай-ақ олар қиын болжамдық тапсырмаларды орындайды: машиналық оқыту алгоритмдері АҚШ Жоғарғы Сотының шешімдерін болжайды, қай сотталушының кепілден қашып кетуі мүмкін екенін анықтайды және балаларды қорғау қызметіне түскен қоңыраулардың қайсысына әлеуметтік қызметкердің тез арада баруы керектігін бағалайды.
Қазіргі уақытта «алгоритм» деген сөзді естігенде осындай қолданбаларды елестеткенімізбен, бұл термин кеңірек мағынаға ие. Бір сөздіктің анықтамасы бойынша, алгоритм — бұл «есептеулерде немесе басқа мәселелерді шешу операцияларында, әсіресе компьютерде орындалатын процесс немесе ережелер жиынтығы». Бұл анықтама бойынша, біз алдыңғы тарауда сипаттаған қарапайым модельдер мен механикалық пайымдаудың басқа түрлері де алгоритмдер болып табылады.
Іс жүзінде механикалық тәсілдердің көптеген түрлері, күлкілі дәрежедегі қарапайым ережелерден бастап ең күрделі және жұмбақ машиналық алгоритмдерге дейін, адам пайымдауынан асып түсе алады. Бұл басымдықтың негізгі себептерінің бірі — жалғыз себебі болмаса да — барлық механикалық тәсілдердің шусыз болуында.
Ережеге негізделген тәсілдердің әртүрлі түрлерін қарастыру және әр тәсілдің қай кезде және қандай жағдайларда құнды болатынын білу үшін біз саяхатымызды 9-тараудағы модельдерден бастаймыз: көптік регрессияға негізделген қарапайым модельдер (яғни, сызықтық регрессия модельдері). Осы бастапқы нүктеден біз күрделілік спектрінің екі қарама-қарсы бағыты бойынша жүреміз — алдымен шектен тыс қарапайымдылықты іздейміз, содан кейін үлкенірек күрделілікті қосамыз (11-сурет).

11-СУРЕТ: Ережелер мен алгоритмдердің төрт түрі
Қарапайымдылық: Төзімді әрі әдемі
Робин Доус 1960 және 1970 жылдары пайымдауды зерттеген Юджиндегі (Орегон штаты) жұлдызды команданың тағы бір мүшесі болды. 1974 жылы Доус болжам тапсырмаларын оңайлатуда үлкен жетістікке жетті. Оның идеясы таңғаларлық, тіпті күпірлік сияқты көрінді: әрбір болжаушының нақты салмағын анықтау үшін көптік регрессияны қолданудың орнына, ол барлық болжаушыларға тең салмақ беруді ұсынды.
Доус тең салмақты формуланы бұрыс сызықтық модель (әр көрсеткішке арнайы салмақ бермей, бәрін тең деп есептейтін математикалық үлгі) деп атады. Оның таңғаларлық жаңалығы мынада болды: бұл тең салмақты модельдер «дұрыс» регрессиялық модельдер сияқты дәл және клиникалық пайымдаулардан әлдеқайда жоғары болды.
Тіпті бұрыс модельдерді жақтаушылардың өздері де бұл пікірдің қисынсыз және «статистикалық интуицияға қайшы» екенін мойындайды. Шынында да, Доус пен оның көмекшісі Бернард Корриган басында өз мақалаларын ғылыми журналдарда жариялауға көп күш жұмсады; редакторлар оларға сенбеді. Егер сіз алдыңғы тараудағы Моника мен Наталидің мысалын ойласаңыз, кейбір болжаушылардың басқалардан маңыздырақ екеніне сенетін шығарсыз. Мысалы, көптеген адамдар техникалық дағдылардан гөрі көшбасшылыққа көбірек салмақ берер еді. Қалайша қарапайым салмақталмаған орташа мән біреудің нәтижесін мұқият салмақталған орташа мәннен немесе сарапшының пайымдауынан жақсырақ болжай алады?
Бүгінде, Доустың жетістігінен көптеген жылдар өткен соң, оның замандастарын таңғалдырған статистикалық құбылыс жақсы зерттелген. Бұдан бұрын түсіндірілгендей, көптік регрессия квадраттық қателерді азайтатын «оңтайлы» салмақтарды есептейді. Бірақ көптік регрессия қатені түпнұсқа деректерде азайтады. Сондықтан формула деректердегі әрбір кездейсоқ ауытқуды болжау үшін өзін икемдейді. Мысалы, егер үлгіде техникалық дағдылары жоғары және сонымен бірге басқа байланыссыз себептермен өте жақсы нәтиже көрсеткен бірнеше менеджер болса, модель техникалық дағдының салмағын асыра көрсетеді.
Мәселе мынада: формула деректер үлгісінен тыс (out of sample) қолданылғанда — яғни басқа деректер жиынтығындағы нәтижелерді болжау үшін қолданылғанда — салмақтар бұдан былай оңтайлы болмайды. Түпнұсқа үлгідегі кездейсоқ ауытқулар жаңа үлгіде болмайды, өйткені олар кездейсоқ еді; жаңа үлгіде техникалық дағдылары жоғары менеджерлердің бәрі бірдей супержұлдыз емес. Ал жаңа үлгіде формула болжай алмайтын басқа кездейсоқ ауытқулар бар. Модельдің болжамдық дәлдігінің нақты өлшемі — оның жаңа үлгідегі нәтижесі, бұл кросс-валидациялық корреляция (модельдің жаңа деректердегі дәлдігін тексеру әдісі) деп аталады. Шын мәнінде, регрессиялық модель түпнұсқа үлгіде тым сәтті, ал кросс-валидациялық корреляция әрқашан түпнұсқа деректердегіден төмен болады. Доус пен Корриган бірнеше жағдайда тең салмақты модельдерді көптік регрессия модельдерімен (кросс-валидацияланған) салыстырды. Олардың мысалдарының бірі Иллинойс университетіндегі психология бойынша тоқсан магистранттың бірінші курстағы GPA көрсеткішін академиялық сәттілікке қатысты он айнымалыны қолдана отырып болжау болды. Стандартты көптік регрессия моделі . 69 корреляциясына қол жеткізді, ол кросс-валидацияда . 57-ге (PC = 69%) дейін төмендеді. Тең салмақты модельдің бірінші курстағы GPA-мен корреляциясы шамамен бірдей болды: . 60 (PC = 70%). Осыған ұқсас нәтижелер басқа да көптеген зерттеулерде алынды.
Кросс-валидациядағы дәлдіктің жоғалуы түпнұсқа үлгі кішкентай болған кезде ең нашар болады, өйткені кішкентай үлгілерде кездейсоқ ауытқулар үлкенірек көрінеді. Доус атап өткен мәселе мынада: әлеуметтік ғылымдардағы зерттеулерде қолданылатын үлгілер әдетте өте кішкентай, сондықтан «оңтайлы» салмақтаудың артықшылығы жоғалады. Статист Ховард Вайнер тиісті салмақтарды бағалау туралы ғылыми мақаласының тақырыпшасында есте қаларлықтай айтқандай: «Бұл ештеңені өзгертпейді» (It Don’t Make No Nevermind). Немесе Доустың сөзімен айтсақ, «бізге өлшемдерімізден дәлірек модельдердің қажеті жоқ». Тең салмақты модельдер жақсы нәтиже береді, өйткені олар үлгі алудағы кездейсоқтықтарға сезімтал емес.
Доус жұмысының тікелей салдары кеңінен танымал болуға лайық: сіз болжағыңыз келетін нәтиже туралы алдын ала деректерсіз-ақ валидті статистикалық болжамдар жасай аласыз. Сізге қажет нәрсе — нәтижемен байланысты екеніне сенуге болатын болжаушылар жиынтығы.
Мысалы, 9-тараудағы мысалдағыдай, бірқатар өлшемдер бойынша бағаланған басқарушылардың жұмыс нәтижесін болжауыңыз керек делік. Сіз бұл ұпайлар маңызды қасиеттерді өлшейтініне сенесіз, бірақ әр ұпайдың нәтижені қаншалықты дәл болжайтыны туралы деректеріңіз жоқ. Сондай-ақ сізде менеджерлердің үлкен үлгісінің жұмысын бақылау үшін бірнеше жыл күту мүмкіндігі де жоқ. Дегенмен, сіз осы жеті ұпайды алып, оларды тең салмақтау үшін қажетті статистикалық жұмысты істеп, нәтижені болжам ретінде қолдана аласыз. Бұл тең салмақты модель қаншалықты жақсы болар еді? Оның нәтижемен корреляциясы . 25 (PC = 58%) болар еді, бұл клиникалық болжамдардан (r = . 15, PC = 55%) әлдеқайда жоғары және кросс-валидацияланған регрессиялық модельге өте ұқсас. Және ол сізде жоқ деректерді немесе күрделі есептеулерді қажет етпейді.
Доустың пайымдауды зерттеуші студенттер арасында мемге айналған сөзін қолдансақ, тең салмақтарда «төзімді сұлулық» бар. Осы идеяны енгізген іргелі мақаланың соңғы сөйлемі тағы бір ұтымды қорытынды ұсынды: «Бүкіл айла — қай айнымалыларды қарау керектігін шешуде және оларды қалай қосу керектігін білуде».
Одан да үлкен қарапайымдылық: Қарапайым ережелер
Жеңілдетудің тағы бір түрі — үнемді модельдер (тек ең маңызды бірнеше көрсеткішке негізделген қарапайым ережелер) немесе қарапайым ережелер. Үнемді модельдер — бұл өте қарапайым, «қолма-қол» жасалған есептеулерге ұқсайтын шындық модельдері. Бірақ кейбір жағдайларда олар таңғаларлық жақсы болжамдар бере алады.
Бұл модельдер көптік регрессияның көптеген адамдарды таңғалдыратын ерекшелігіне негізделген. Мысалы, сіз нәтижені жақсы болжайтын екі көрсеткішті қолданасыз делік — олардың нәтижемен корреляциясы . 60 (PC = 71%) және . 55 (PC = 69%). Сондай-ақ екі болжаушы өзара . 50 корреляциясымен байланысты делік. Екі болжаушы оңтайлы біріктірілгенде болжамыңыз қаншалықты жақсы болады деп ойлайсыз? Жауап көңіл көншітпейді. Корреляция . 67 (PC = 73%) болады, бұл бұрынғыдан жоғары, бірақ айтарлықтай емес.
Бұл мысал жалпы ережені көрсетеді: екі немесе одан да көп өзара байланысты болжаушылардың комбинациясы олардың ішіндегі ең жақсысынан сәл ғана асып түседі. Өмірде болжаушылар дерлік әрқашан бір-бірімен байланысты болғандықтан, бұл статистикалық факт болжаушылардың аз санын қолданатын үнемді тәсілдерді қолдануды қолдайды. Есептеусіз немесе аз ғана есептеумен қолдануға болатын қарапайым ережелер кейбір жағдайларда көптеген болжаушыларды қолданатын модельдермен салыстырғанда таңғаларлық дәл болжамдар берді.
Зерттеушілер тобы 2020 жылы әртүрлі болжам мәселелеріне, соның ішінде кепілдік судьяларының сот процесін күтіп отырған сотталушыларды босату немесе қамауда ұстау туралы шешіміне үнемді тәсілді қолдану бойынша ауқымды жұмыс жариялады. Бұл шешім — сотталушының мінез-құлқын жанама болжау. Егер кепілдік негізсіз бас тартылса, ол адам жеке тұлғаға және қоғамға айтарлықтай шығын әкеліп, босқа қамауда отырады. Егер кепілдік қате адамға берілсе, ол сотқа дейін қашып кетуі немесе тіпті басқа қылмыс жасауы мүмкін.
Зерттеушілер жасаған модель сотталушының кепілден қашып кету ықтималдығын жоғары дәрежеде болжайтын екі ғана көрсеткішті қолданады: сотталушының жасы (ересек адамдардың қашу қаупі төмен) және бұрын жіберіп алған сот отырыстарының саны (бұрын сотқа келмегендер қайталауға бейім келеді). Модель бұл екі көрсеткішті қауіп ұпайы ретінде қолдануға болатын ұпайлар санына аударады. Сотталушының қаупін есептеу компьютерді, тіпті калькуляторды да қажет етпейді.
Нақты деректер жиынтығында тексерілгенде, бұл үнемді модель әлдеқайда көп айнымалыларды қолданатын статистикалық модельдер сияқты жақсы нәтиже көрсетті. Үнемді модель қашу қаупін болжауда дерлік барлық адам-судьялардан жақсырақ жұмыс істеді.
Дәл осындай үнемді тәсіл кішкентай бүтін сандармен (-3 пен +3 аралығында) салмақталған бес көрсеткішке дейін қолданыла отырып, маммографиялық деректерден ісіктің ауырлығын анықтау, жүрек ауруын диагностикалау және несиелік тәуекелді болжау сияқты әртүрлі тапсырмаларға қолданылды. Барлық осы тапсырмаларда үнемді ереже күрделірек регрессиялық модельдер сияқты жақсы нәтиже берді (бірақ әдетте машиналық оқыту сияқты жақсы емес).
Қарапайым ережелердің күшін көрсететін тағы бір демонстрацияда басқа зерттеушілер тобы ұқсас, бірақ бөлек сот мәселесін — рецидивизмді (қылмыстың қайталануын) болжауды зерттеді. Тек екі көрсеткішті қолдана отырып, олар сотталушының қауіп деңгейін бағалау үшін 137 айнымалыны қолданатын қолданыстағы құралдың валидтілігіне қол жеткізе алды. Бұл екі болжаушы (жасы және бұрынғы соттылығының саны) кепілдік моделінде қолданылатын екі фактормен тығыз байланысты және олардың қылмыстық мінез-құлықпен байланысы жақсы құжатталған.
Үнемді ережелердің тартымдылығы — олардың ашықтығы мен қолдануға оңайлығында. Сонымен қатар, бұл артықшылықтар күрделірек модельдермен салыстырғанда дәлдіктің салыстырмалы түрде аз шығынымен алынады.
Үлкенірек күрделілік: Машиналық оқытуға қарай
Саяхатымыздың екінші бөлімінде енді күрделілік спектрінің қарама-қарсы бағытына қарай жүрейік. Егер біз әлдеқайда көп болжаушыларды қолдана алсақ, олардың әрқайсысы туралы көбірек деректер жинасақ, ешбір адам байқай алмайтын байланыс үлгілерін тапсақ және жақсырақ болжамға қол жеткізу үшін осы үлгілерді модельдесек ше? Бұл, негізінде, Жасанды интеллектінің (AI) берген уәдесі.
Өте үлкен деректер жиынтығы күрделі талдаулар үшін өте маңызды және мұндай деректердің қолжетімділігінің артуы соңғы жылдардағы AI-дың қарқынды дамуының негізгі себептерінің бірі болып табылады. Мысалы, үлкен деректер жиынтығы «сынған аяқ» ерекшеліктерімен (модель ескере алмайтын, бірақ нәтижеге тікелей әсер ететін айқын жағдайлар) механикалық түрде жұмыс істеуге мүмкіндік береді. Бұл біршама құпия тіркес Мил елестеткен мысалға барып тіреледі: адамдардың бүгін кешке киноға бару ықтималдығын болжауға арналған модельді қарастырыңыз. Модельге қаншалықты сенсеңіз де, егер сіз нақты бір адамның аяғы сынып қалғанын білсеңіз, оның кеші қалай болатынын модельден гөрі жақсырақ білесіз.
Қарапайым модельдерді қолданғанда, сынған аяқ принципі шешім қабылдаушылар үшін маңызды сабақ береді: ол оларға модельдің шешімін қашан жоққа шығару керектігін және қашан болмайтынын айтады. Егер сізде модель ескере алмайтын шешуші ақпарат болса, бұл — шынайы сынған аяқ және сіз модельдің ұсынысын жоққа шығаруыңыз керек. Екінші жағынан, сізде мұндай жеке ақпарат болмаса да, кейде модельдің ұсынысымен келіспей қаласыз. Мұндай жағдайларда модельді жоққа шығаруға деген құштарлығыңыз дәл сол болжаушыларға қолданып жатқан жеке патерніңізді көрсетеді. Бұл жеке патерн валидті емес болуы ықтимал болғандықтан, сіз модельдің жұмысына араласпауыңыз керек; сіздің араласуыңыз болжамның дәлдігін төмендетуі мүмкін.
Машиналық оқыту модельдерінің болжамдық тапсырмалардағы табысының бір себебі — олар осындай «сынған аяқтарды» — адам ойлай алғаннан да көп мөлшерде таба алуында. Көптеген жағдайлар туралы орасан зор деректер болса, киноға барушылардың мінез-құлқын бақылайтын модель, мысалы, әдеттегі кино күнінде ауруханаға барған адамдардың сол кеште фильм көруі екіталай екенін іс жүзінде біле алады. Осылайша сирек кездесетін оқиғалардың болжамын жақсарту адамның қадағалау қажеттілігін азайтады.
AI-дың істейтін ісінде сиқыр да, түсіністік те жоқ; бұл жай ғана патерн табу. Біз машиналық оқытудың күшіне таңдануымыз керек болғанымен, AI аяғы сынған адамның неліктен киноға бармайтынын түсінуі үшін біраз уақыт қажет болатынын есте ұстағанымыз жөн.
Мысал: Кепілдік туралы жақсырақ шешімдер
Осыған дейін аталған зерттеушілер тобы кепілмен босату мәселесіне қарапайым ережелерді қолданған кезбен бір уақытта, Сендхил Муллайнатан бастаған басқа топ дәл осы тапсырманы орындау үшін күрделі ЖИ (жасанды интеллект) модельдерін жаттықтырды. ЖИ тобының қолында үлкенірек деректер жиынтығы — 758 027 кепіл шешімі болды. Әрбір жағдай бойынша топ судьяға қолжетімді ақпараттарды пайдаланды: айыпталушының ағымдағы құқық бұзушылығы, соттылық тарихы (бұрынғы қылмыстары мен жазалары туралы мәліметтер) және бұрын сотқа келмей қалған кездері. Алгоритмді жаттықтыру үшін жастан басқа ешқандай демографиялық мәліметтер қолданылмаған. Зерттеушілер сондай-ақ әр іс бойынша айыпталушының босатылған-босатылмағанын және босатылған жағдайда оның сотқа келуден бас тартқанын немесе қайта тұтқындалғанын білді. (Айыпталушылардың 74%-ы босатылған, олардың 15%-ы сотқа келмей қалған, ал 26%-ы қайта тұтқындалған). Осы деректер арқылы зерттеушілер машиналық оқыту алгоритмін жаттықтырып, оның нәтижесін бағалады. Модель машиналық оқыту арқылы құрылғандықтан, ол сызықтық комбинациялармен шектелмеді. Егер ол деректерден күрделірек заңдылықты байқаса, өз болжамдарын жақсарту үшін осы үлгіні қолдана алды.
Модель кепілге жіберу/жібермеу туралы шешім емес, сандық балл түріндегі қашып кету қаупінің болжамын жасауға арналған. Бұл тәсіл қауіптің ең жоғарғы рұқсат етілген шегін (яғни, айыпталушыға кепілден бас тартылатын қауіп деңгейін) анықтау үшін модель жасай алмайтын бағалаушы пайымдау қажет екенін мойындайды. Дегенмен, зерттеушілер қауіп шегі қай жерде белгіленсе де, олардың моделінің болжамдық баллын пайдалану адам-судьялардың жұмысына қарағанда жақсырақ нәтиже беретінін есептеп шығарды. Егер қауіп шегі кепілден бас тартылғандар саны судьялар шешім қабылдағандағыдай деңгейде қалса, Муллайнатан тобының есептеуінше, қылмыс деңгейін 24%-ға дейін төмендетуге болады, өйткені түрмеге нақты рецидив (қылмысты қайталау) жасау ықтималдығы жоғары адамдар жабылатын болады. Керісінше, егер қауіп шегі қылмысты көбейтпестен кепілден бас тартылғандар санын мүмкіндігінше азайту үшін белгіленсе, зерттеушілердің есебі бойынша қамаудағылар санын 42%-ға дейін қысқартуға болады. Басқаша айтқанда, машиналық оқыту моделі қай айыпталушының қаупі жоғары екенін болжауда адам-судьялардан әлдеқайда жақсы нәтиже көрсетеді.
Машиналық оқыту арқылы құрылған модель дәл сондай ақпаратты қолданған сызықтық модельдерге қарағанда әлдеқайда табысты болды. Мұның себебі қызық: «Машиналық оқыту алгоритмі айнымалылардың үйлесімінен басқа жағдайда байқалмай қалуы мүмкін маңызды сигналдарды табады». Алгоритмнің басқа әдістермен оңай мүлт кететін үлгілерді табу қабілеті, әсіресе, алгоритм «ең жоғары қауіпті» деп жіктеген айыпталушыларға қатысты айқын көрінеді. Яғни, деректердегі кейбір үлгілер сирек кездесетініне қарамастан, жоғары қауіпті өте дәл болжайды. Алгоритмнің сирек, бірақ шешуші үлгілерді тауып алуы бізді қайтадан «сынған аяқтар» тұжырымдамасына алып келеді.
Зерттеушілер сондай-ақ алгоритмді әрбір судьяның моделін құру үшін пайдаланды (бұл 9-тарауда сипатталған судья моделіне ұқсас, бірақ қарапайым сызықтық комбинациялармен шектелмейді). Осы модельдерді барлық деректер жиынтығына қолдану арқылы топ судьялар дәл сондай істерді көргенде қандай шешім қабылдайтынын имитациялап, шешімдерді салыстыра алды. Нәтижелер кепіл шешімдерінде айтарлықтай жүйелік шудың бар екенін көрсетті. Оның бір бөлігі — деңгейлік шу: судьяларды жұмсақтығы бойынша реттегенде, ең жұмсақ бестік (яғни, босату деңгейі ең жоғары 20% судьялар) айыпталушылардың 83%-ын босатса, ал ең қатал бестік тек 61%-ын босатқан. Сондай-ақ, судьялардың қай айыпталушының қашып кету қаупі жоғары екендігі туралы пайымдау үлгілері де әртүрлі. Бір судья төмен қауіпті деп санаған айыпталушыны жалпы алғанда қатал емес басқа бір судья жоғары қауіпті деп санауы мүмкін. Бұл нәтижелер үлгілік шудың айқын дәлелі болып табылады. Егжей-тегжейлі талдау көрсеткендей, істер арасындағы айырмашылықтар ауытқудың (дисперсияның) 67%-ын құраса, жүйелік шу 33%-ын құраған. Жүйелік шудың ішінде деңгейлік шу (яғни, орташа қатаңдық деңгейіндегі айырмашылықтар) болғанымен, оның негізгі бөлігі (79%) үлгілік шу болды.
Ақырында, бақытымызға орай, машиналық оқыту бағдарламасының жоғары дәлдігі судьялар көздейтін басқа да маңызды мақсаттарға — атап айтқанда, нәсілдік әділдікке — зиянын тигізбейді. Теориялық тұрғыдан алғанда, алгоритм нәсілдік деректерді пайдаланбаса да, бағдарлама байқаусызда нәсілдік теңсіздікті ушықтыруы мүмкін. Бұл теңсіздіктер егер модель нәсілмен тығыз байланысты болжаушыларды (мысалы, почта индексі) қолданса немесе алгоритм жаттықтырылған деректер көзі біржақты болса туындауы мүмкін. Мысалы, егер болжаушы ретінде бұрынғы тұтқындаулар саны пайдаланылса және бұрынғы тұтқындауларға нәсілдік кемсітушілік әсер еткен болса, онда шыққан алгоритм де кемсітушілікке жол береді.
Принципиалды тұрғыдан мұндай кемсітушілік қаупі бар болғанымен, бұл алгоритмнің шешімдері маңызды аспектілерде судьяларға қарағанда нәсілдік тұрғыдан аз біржақты болып шықты. Мысалы, егер қауіп шегі судьялардың шешімдерімен бірдей қылмыс деңгейіне қол жеткізу үшін орнатылса, онда алгоритм түрмеге түсті адамдарды (people of color) 41%-ға аз қамайды. Ұқсас нәтижелер басқа сценарийлерде де байқалды: дәлдіктің артуы нәсілдік теңсіздікті күшейтпеуі тиіс — және зерттеу тобы көрсеткендей, алгоритмге оларды азайту туралы оңай нұсқау беруге болады.
Басқа саладағы тағы бір зерттеу алгоритмдердің дәлдікті арттырумен қатар кемсітушілікті қалай азайта алатынын көрсетеді. Колумбия бизнес мектебінің профессоры Бо Коугилл ірі технологиялық компаниядағы бағдарламалық жасақтама инженерлерін жұмысқа алу процесін зерттеді. Сұхбатқа кімді шақыруды таңдау үшін адам-рекрутерлерді пайдаланудың орнына, Коугилл кандидаттардың түйіндемелерін іріктейтін машиналық оқыту алгоритмін жасап, оны компания алған және бағалаған үш жүз мыңнан астам өтінім негізінде жаттықтырды. Алгоритм таңдаған кандидаттардың сұхбаттан кейін жұмысқа шақыру алу ықтималдығы адамдар таңдаған кандидаттарға қарағанда 14%-ға жоғары болды. Кандидаттар жұмысқа шақыру алған кезде, алгоритм тобының оны қабылдау ықтималдығы адам таңдаған топқа қарағанда 18%-ға жоғары болған. Сондай-ақ, алгоритм нәсілі, жынысы және басқа да көрсеткіштері бойынша әртүрлі (диверсификацияланған) кандидаттар тобын таңдады; ол «бейдәстүрлі» кандидаттарды — мысалы, элиталық оқу орнын бітірмегендерді, бұрын жұмыс тәжірибесі жоқтарды және ешкім ұсынбағандарды (рекомендациясы жоқтарды) таңдауға әлдеқайда бейім болды. Адамдар бағдарламалық жасақтама инженерінің «типтік» бейнесінің барлық талаптарына сай келетін түйіндемелерді ұнатуға бейім болса, алгоритм әрбір маңызды болжаушы факторға тиісті салмағын берді.
Анық болу үшін айтайық, бұл мысалдар алгоритмдердің әрқашан әділ, бейтарап немесе кемсітушіліктен ада екенін дәлелдемейді. Белгілі бір мысал — жұмысқа үміткерлердің табысын болжауы тиіс, бірақ іс жүзінде бұрынғы лауазымды өсіру шешімдерінің үлгісінде жаттықтырылған алгоритм. Әрине, мұндай алгоритм бұрынғы лауазымды өсіру шешімдеріндегі барлық адамзаттық біржақтылықты қайталайтын болады.
Нәсілдік немесе гендерлік теңсіздікті жалғастыратын алгоритм құру мүмкін, тіпті бұл тым оңай да болуы мүмкін, және дәл солай істеген алгоритмдер туралы көптеген мәліметтер бар. Осы жағдайлардың көзге көп түсуі алгоритмдік шешім қабылдаудағы біржақтылыққа қатысты алаңдаушылықтың артуын түсіндіреді. Алайда, алгоритмдер туралы жалпы қорытынды жасамас бұрын, кейбір алгоритмдердің адам-судьялардан тек дәлірек емес, сонымен бірге әділірек екенін есте ұстауымыз керек.
Неліктен біз ережелерді жиі қолданбаймыз?
Механикалық шешім қабылдауға жасалған бұл қысқа шолуды қорытындылай келе, кез келген түрдегі ережелердің адам пайымдауынан артықшылығының екі себебін қарастырамыз. Біріншіден, 9-тарауда сипатталғандай, тек ең соңғы және күрделі әдістер ғана емес, барлық механикалық болжау әдістері адам пайымдауын айтарлықтай жақсартады. Жеке үлгілер мен сәттік шудың жиынтығы адам пайымдауының сапасына соншалықты қатты әсер ететіндіктен, қарапайымдылық пен шудың болмауы үлкен артықшылық болып табылады. Тек ақылға қонымды қарапайым ережелердің өзі әдетте адам пайымдауынан жақсы нәтиже береді.
Екіншіден, деректер кейде күрделі ЖИ әдістеріне нақты үлгілерді анықтауға және қарапайым модельдің болжамдық қуатынан әлдеқайда асып түсуге мүмкіндік беретіндей бай болады. ЖИ осылайша табысқа жеткенде, бұл модельдердің адам пайымдауынан артықшылығы тек шудың жоқтығында ғана емес, сонымен қатар әлдеқайда көп ақпаратты пайдалану қабілетінде болып табылады.
Осы артықшылықтар мен оларды растайтын көптеген дәлелдерге қарамастан, біз осы кітапта талқылайтын кәсіби пайымдау түрлері үшін алгоритмдердің неге әлдеқайда кең қолданылмайтынын сұраудың мәні бар. Алгоритмдер мен машиналық оқыту туралы қызу әңгімелерге қарамастан және белгілі бір салалардағы маңызды ерекшеліктерді есепке алмағанда, оларды қолдану әлі де шектеулі. Көптеген сарапшылар клиникалық және механикалық тәсілдер арасындағы пікірталастарға мән бермей, өз пайымдауларына сенуді жөн көреді. Олар өз интуицияларына сенеді және машиналардың жақсырақ істей алатынына күмәнданады. Олар алгоритмдік шешім қабылдау идеясын адамгершілікке жатпайтын және өз жауапкершілігінен бас тарту деп санайды.
Мысалы, медициналық диагностикада алгоритмдерді қолдану, әсерлі жетістіктерге қарамастан, әлі күнге дейін күнделікті әдетке айналмаған. Жұмысқа алу және лауазымды өсіру шешімдерінде алгоритмдерді қолданатын ұйымдар аз. Голливуд студияларының басшылары фильмдерге формула бойынша емес, өз пайымдауы мен тәжірибесі негізінде рұқсат («жасыл жарық») береді. Кітап баспагерлері де солай істейді. Майкл Льюистің бестселлері «Moneyball»-да баяндалған статистикаға құмарланған «Окленд Атлетикс» бейсбол командасы туралы хикаяның осыншалықты әсер қалдыруының себебі — спорт командаларының шешім қабылдау процесінде алгоритмдік қатаңдықтың әдеттегі ереже емес, ұзақ уақыт бойы ерекше жағдай болып келгенінде. Тіпті бүгінде жаттықтырушылар, менеджерлер және олармен жұмыс істейтін адамдар көбінесе өз түйсіктеріне сенеді және статистикалық талдаудың жақсы пайымдауды алмастыруы мүмкін еместігін алға тартады.
1996 жылғы мақалада Мил және оның тең авторы психиатрлар, дәрігерлер, судьялар және басқа да мамандардың механикалық пайымдауға қатысты қарсылықтарының кем дегенде он жеті түрін тізіп көрсетті (және оларға тойтарыс берді). Авторлар мамандардың қарсылығын әлеуметтік-психологиялық факторлардың жиынтығымен, соның ішінде «технологиялық жұмыссыздықтан қорқу», «білімнің төмендігі» және «компьютерлерге деген жалпы жеккөрінішпен» түсіндіруге болады деген қорытындыға келді.
Содан бері зерттеушілер бұл қарсылыққа ықпал ететін қосымша факторларды анықтады. Біз мұнда бұл зерттеулерге толық шолу жасауды мақсат етпейміз. Осы кітаптағы біздің мақсатымыз — судья Франкель айтқандай «адамдарды машиналармен алмастыруды» жақтау емес, адам пайымдауын жақсарту бойынша ұсыныстар беру.
Бірақ механикалық болжауға деген адамзаттық қарсылықты не қозғайтыны туралы кейбір тұжырымдар біздің адам пайымдауын талқылауымызға қатысты. Соңғы зерттеулерден бір негізгі түсінік пайда болды: адамдар алгоритмдерге жүйелі түрде күдікпен қарамайды. Мысалы, адам мен алгоритмнің кеңесі арасында таңдау берілгенде, олар көбінесе алгоритмді жөн көреді. Алгоритмдерге қарсылық немесе алгоритмнен қашқақтау (алгоритмдерге сенімсіздік білдіру) әрқашан жаңа шешімдерді қабылдаудан үзілді-кесілді бас тарту түрінде көрінбейді. Көбінесе адамдар алгоритмге мүмкіндік беруге дайын, бірақ оның қателік жасағанын көрген бойда оған сенуді тоқтатады.
Бір деңгейде бұл реакция ақылға қонымды болып көрінеді: сенуге болмайтын алгоритммен неге бас қатыру керек? Адам ретінде біз өзіміздің қателесетінімізді жақсы білеміз, бірақ бұл — біз бөлісуге дайын емес артықшылығымыз. Біз машиналардан мінсіздікті күтеміз. Егер бұл үміт ақталмаса, біз олардан бас тартамыз.
Осы интуитивті үмітке байланысты, адамдар алгоритмдерге сенімсіздік танытып, өз пайымдауларын қолдануды жалғастыра береді, тіпті бұл таңдау анық төмен нәтижелерге әкелсе де. Бұл көзқарас терең тамыр жайған және дерлік мінсіз болжамдық дәлдікке қол жеткізілмейінше өзгеруі екіталай.
Бақытымызға орай, ережелер мен алгоритмдерді жақсырақ ететін қасиеттердің көбін адам пайымдауында қайталауға болады. Біз ақпаратты ЖИ моделі сияқты тиімді пайдаланудан үмітене алмаймыз, бірақ қарапайым модельдердің қарапайымдылығы мен шусыздығына еліктеуге тырыса аламыз. Жүйелік шуды азайтатын әдістерді қолдана алғанымызша, болжамдық пайымдаулардың сапасында жақсаруды көруіміз керек. Пайымдауларымызды қалай жақсартуға болатыны — 5-бөлімнің негізгі тақырыбы.
Ережелер мен алгоритмдер туралы айтар болсақ
«Деректер көп болған кезде, машиналық оқыту алгоритмдері адамдардан да, қарапайым модельдерден де жақсырақ жұмыс істейді. Бірақ тіпті ең қарапайым ережелер мен алгоритмдердің адам-судьялардан үлкен артықшылығы бар: олар шудан ада және болжаушылар туралы күрделі, әдетте жарамсыз түсініктерді қолдануға тырыспайды».
«Болжауымыз керек нәтиже туралы деректер жетіспейтіндіктен, біз неге тең салмақты модельді қолданбаймыз? Ол тиісті модель сияқты жақсы жұмыс істейді және әр жағдайды жеке қарастыратын адам пайымдауынан сөзсіз жақсырақ болады».
«Сіз модельдің болжамымен келіспейсіз. Мен түсінемін. Бірақ мұнда нақты «сынған аяқ» жағдайы бар ма, әлде сізге жай ғана болжам ұнамай тұр ма? »
«Әрине, алгоритм қателіктер жібереді. Бірақ егер адам-судьялар бұдан да көп қателіктер жіберсе, біз кімге сенуіміз керек? »
11-ТАРАУ
Объективті білместік
Біз соңғы екі тараудың материалдарын, яғни адам пайымдауының шектеулі жетістіктері туралы айнымас тұжырымдарды басшылар аудиториясымен жиі бөлістік. Біз жеткізгіміз келетін бұл хабар жарты ғасырдан астам уақыт бойы бар, және біз аз ғана шешім қабылдаушылардың бұған кезікпей қалғанына күмәнданамыз. Бірақ олар бұған қарсы тұра алатыны сөзсіз.
Аудиториямыздағы кейбір басшылар кез келген талдаудан гөрі өз түйсіктеріне (ішкі сезіміне) көбірек сенетіндерін мақтанышпен айтады. Көптеген басқалары онша ашық айтпаса да, дәл осындай көзқараста. Басқарушылық шешім қабылдау саласындағы зерттеулер көрсеткендей, басшылар, әсіресе жоғары лауазымды және тәжірибелілері, интуиция, ішкі сезім (gut feel) немесе жай ғана пайымдау (біз осы кітапта қолданатын мағынадан басқаша мағынада) деп аталатын нәрсеге кеңінен жүгінеді.
Қысқасы, шешім қабылдаушылар өздерінің ішкі сезімдерін тыңдағанды ұнатады және көбісі естігеніне риза сияқты. Бұл сұрақ тудырады: бедел мен үлкен өзіне деген сенімділік ұштасқан бұл адамдар өздерінің ішкі сезімдерінен нақты не естиді?
Басқарушылық шешім қабылдаудағы интуицияға берілген бір шолу оны былай анықтайды: «белгілі бір іс-қимыл бағыты туралы пайымдау, ол ойға дұрыстық немесе қисындылық сезімімен келеді, бірақ нақты тұжырымдалған себептері немесе негіздемелері болмайды — негізінен неге екенін білмей-ақ «білу» сезімі». Біз бұл «неге екенін білмей-ақ білу» сезімі іс жүзінде біз 4-тарауда айтып өткен пайымдаудың аяқталғаны туралы ішкі сигнал екенін алға тартамыз.
Ішкі сигнал — бұл адамдар пайымдауды аяқтаған кезде қол жеткізу үшін көп жұмыс істейтін (немесе кейде онша жұмыс істемейтін) өзін-өзі марапаттау түрі. Бұл — қанағаттанарлық эмоционалды тәжірибе, үйлесімділіктің жағымды сезімі, мұнда қаралған дәлелдер мен жасалған пайымдау дұрыс болып көрінеді. Пазлдың барлық бөліктері сәйкес келгендей болады. (Кейінірек біз бұл үйлесімділік сезімі көбінесе сәйкес келмейтін дәлелдерді жасыру немесе елемеу арқылы нығайтылатынын көреміз).
Ішкі сигналды маңызды — және жаңылыстырушы — ететін нәрсе, оның сезім ретінде емес, сенім ретінде қабылдануында. Бұл эмоционалды тәжірибе («дәлелдер дұрыс сияқты») адамның өз пайымдауының негізділігіне деген рационалды сенімділігі болып көрінеді («Неге екенін білмесем де, мен білемін»).
Алайда, сенімділік дәлдіктің кепілі емес және көптеген сенімді болжамдар қате болып шығады. Біржақтылық пен шу болжам қателіктеріне ықпал еткенімен, мұндай қателіктердің ең үлкен көзі болжамдық пайымдаулардың қаншалықты жақсы екендігінде емес. Ол олардың қаншалықты жақсы бола алатындығының шегінде. Біз объективті білместік (немесе объективті надандық) деп атайтын бұл шек осы тараудың басты тақырыбы болып табылады.
Объективті білместік
Егер сіз жиі болжамдық пайымдаулар жасайтын болсаңыз, өзіңізге мынадай сұрақ қойып көріңіз. Сұрақ кез келген тапсырмаға қатысты болуы мүмкін — мысалы, акцияларды таңдау немесе кәсіби спортшылардың нәтижелерін болжау. Бірақ қарапайымдылық үшін біз 9-тарауда қолданған мысалды таңдаймыз: жұмысқа кандидаттарды іріктеу. Көптеген жылдар бойы жүз кандидатты бағаладыңыз делік. Енді сіз жасаған бағалауларыңызды кандидаттардың содан бергі объективті бағаланған жұмыс нәтижелерімен салыстыру арқылы шешімдеріңіздің қаншалықты дұрыс болғанын тексеруге мүмкіндігіңіз бар. Егер сіз кездейсоқ екі кандидатты таңдасаңыз, сіздің алдын ала жасаған пайымдауыңыз бен кейінгі бағалаулар қаншалықты жиі сәйкес келер еді? Басқаша айтқанда, кез келген екі кандидатты салыстырған кезде, сіз көбірек әлеуеті бар деп санаған кандидаттың іс жүзінде жоғары нәтиже көрсеткен адам болу ықтималдығы қандай?
Біз бұл сұрақты басшылар топтарына жиі қоямыз. Ең жиі кездесетін жауаптар 75–85% аралығында болады және біз бұл жауаптар қарапайымдылықпен және мақтаншақ болып көрінбеу ниетімен шектелген деп күдіктенеміз. Жеке, оңаша сөйлесулер шынайы сенімділік сезімі бұдан да жоғары екенін көрсетеді.
Сіз енді сәйкестік пайызы (percent concordant) статистикасымен таныс болғандықтан, бұл бағалау тудыратын мәселені оңай көре аласыз. 80% PC шамамен . 80 корреляциясына сәйкес келеді. Болжамдық қуаттың мұндай деңгейіне шынайы өмірде сирек қол жеткізіледі. Кадрларды іріктеу саласындағы соңғы шолу көрсеткендей, адам-бағалаушылардың нәтижелері бұл көрсеткішке жақындамайды да. Орташа алғанда, олар . 28 болжамдық корреляцияға қол жеткізеді (PC = 59%).
Егер сіз кадрларды іріктеудегі қиындықтарды ескерсеңіз, көңіл көншітпейтін нәтижелер онша таңқаларлық емес. Бүгін жаңа жұмыс бастаған адам көптеген қиындықтар мен мүмкіндіктерге кезігеді, және кездейсоқтық оның өмірінің бағытын көптеген жолдармен өзгертуге араласады. Ол өзіне сенетін, мүмкіндіктер жасайтын, жұмысын ілгерілететін және оның өзіне деген сенімділігі мен ынтасын арттыратын жетекшіге жолығуы мүмкін. Сондай-ақ оның жолы болмай, өз кінәсі болмаса да, мансабын жігерді құм қиятын сәтсіздіктен бастауы мүмкін. Жеке өмірінде де жұмыс өнімділігіне әсер ететін оқиғалар болуы мүмкін. Бұл оқиғалар мен жағдайлардың ешқайсысын бүгін болжау мүмкін емес — оны сіз де, басқа ешкім де, әлемдегі ең жақсы болжамдық модель де болжай алмайды. Бұл шешілмейтін белгісіздік сіз болжауға тырысып жатқан нәтиже туралы қазіргі уақытта білу мүмкін емес нәрсенің бәрін қамтиды.
Сонымен қатар, кандидаттар туралы көптеген мәліметтер принципиалды түрде білуге болатын нәрселер, бірақ сіз пайымдау жасаған кезде олар белгісіз болады. Біздің мақсатымыз үшін бұл білімдегі олқылықтардың жеткілікті болжамдық тестілердің жоқтығынан ба, көбірек ақпарат алу шығындары ақталмайды деген шешіміңізден бе, әлде фактілерді анықтаудағы өз немқұрайлылығыңыздан ба — бұның маңызы жоқ. Қалай болғанда да, сіз ақпараттың мінсіз емес күйіндесіз.
Шешілмейтін белгісіздік (мүлдем білу мүмкін емес нәрсе) де, кемелсіз ақпарат та (білуге болатын, бірақ белгісіз нәрсе) мінсіз болжамды мүмкін емес етеді. Бұл белгісіздіктер сіздің пайымдауыңыздағы біржақтылық немесе шу мәселелері емес; олар тапсырманың объективті сипаттамалары. Маңызды белгісіздіктерді объективті білместік арқылы түсіну қолжетімді дәлдікті қатты шектейді. Біз мұнда терминологиялық еркіндікке жол беріп, жиі қолданылатын «белгісіздік» сөзін «білместік» (надандық) сөзімен алмастырамыз. Бұл термин әлем мен болашаққа қатысты белгісіздік пен бірдей болуы тиіс пайымдаулардағы өзгергіштік болып табылатын шу арасындағы шатасу қаупін азайтуға көмектеседі.
Кейбір жағдайларда ақпарат көбірек (және объективті білместік азырақ) болады. Көптеген кәсіби пайымдаулар өте жақсы. Көптеген ауруларға қатысты дәрігерлердің болжамдары өте дәл, ал көптеген құқықтық даулар бойынша заңгерлер судьялардың қалай шешім қабылдайтынын үлкен дәлдікпен айтып бере алады.
Жалпы алғанда, болжау тапсырмаларымен айналысатын адамдар өздерінің объективті надандығын (болашақтың белгісіздігіне байланысты ақпараттың жетіспеушілігі) жете бағаламайды деп сеніммен айтуға болады. Асыра сенімділік — ең жақсы зерттелген когнитивті бұрмалаулардың (ойлау жүйесіндегі жүйелі қателіктер) бірі. Әсіресе, шектеулі ақпаратқа сүйене отырып, дәл болжам жасау қабілетіне деген сенімділік тым жоғары екені белгілі. Болжамдық пайымдаулардағы шу туралы айтқанымызды объективті надандыққа да қатысты айтуға болады: болжам бар жерде надандық та бар және ол сіз ойлағаннан әлдеқайда көп.
Асыра сенімді пайымдаушылар
Біздің жақын досымыз, психолог Филип Тетлок — шындыққа деген адалдығымен және ерекше әзіл сезімімен танымал тұлға. 2005 жылы ол «Expert Political Judgment» (Саяси сарапшылардың пайымдауы) атты кітабын жарыққа шығарды. Бұл бейтарап атауға қарамастан, кітап сарапшылардың саяси оқиғаларды дәл болжау қабілетіне жасалған жойқын соққы болды.
Тетлок үш жүзге жуық сарапшының болжамдарын зерттеді: олардың ішінде танымал журналистер, беделді академиктер және мемлекет басшыларының жоғары лауазымды кеңесшілері болды. Ол олардың саяси, экономикалық және әлеуметтік болжамдарының қаншалықты орындалғанын тексерді. Зерттеу жиырма жылға созылды; ұзақ мерзімді болжамдардың дұрыстығын білу үшін төзімділік қажет.
Тетлоктың басты тұжырымы мынадай болды: ірі саяси оқиғаларға қатысты болжам жасауда «сарапшы» деп аталатындар таңғаларлықтай дәрменсіз болып шықты. Кітаптағы: «Орташа статистикалық сарапшы дартс лақтырған шимпанземен бірдей дәлдік көрсетті», — деген өткір сөйлем оны әлемге танымал етті. Кітаптың негізгі ойын нақтырақ айтсақ: «саяси және экономикалық үрдістерге түсініктеме беру немесе кеңес беру» арқылы күн көретін сарапшылар жаңадан туындап жатқан жағдайларды «оқуда» журналистерден немесе «New York Times» газетінің зейінді оқырмандарынан артық емес еді. Әрине, сарапшылар керемет оқиғалар айтып бере алатын. Олар жағдайды талдап, оның қалай өрбитіні туралы әсерлі сурет салатын және телестудияларда өздерімен келіспейтіндердің қарсылықтарын үлкен сеніммен жоққа шығаратын. Бірақ олар шын мәнінде не болатынын білді ме? Неғайбыл.
Тетлок бұл қорытындыға оқиғаларды баяндау тәсілін ысырып тастау арқылы келді. Әр мәселе бойынша ол сарапшылардан үш ықтимал нәтиженің (статус-кво, бір нәрсенің көбеюі немесе азаюы) ықтималдығын анықтауды сұрады. Дартс лақтырған шимпанзе шындыққа қарамастан, бұл нәтижелердің әрқайсысын бірдей ықтималдықпен — үштен бірімен «таңдар» еді. Тетлоктың сарапшылары бұл өте төмен стандарттан әрең асты. Орташа алғанда, олар болған оқиғаларға болмағандарға қарағанда сәл жоғарырақ ықтималдық берді, бірақ олардың жұмысындағы ең басты ерекшелік — өз болжамдарына деген шектен тыс сенімділік болды. Әлемнің қалай жұмыс істейтіні туралы нақты теориялары бар пайымдаушылар ең сенімді және ең қате болжам жасаушылар болып шықты.
Тетлоктың тұжырымдары нақты оқиғалар туралы егжей-тегжейлі ұзақ мерзімді болжам жасау мүмкін емес екенін көрсетеді. Әлем — кішігірім оқиғалардың үлкен салдары болуы мүмкін бейберекет орын. Мысалы, ұрықтану сәтінде тарихтағы кез келген маңызды тұлғаның (сондай-ақ маңызды емес тұлғалардың да) басқа жыныспен туылу мүмкіндігі тең болғанын қарастырайық. Болжау мүмкін емес оқиғалар міндетті түрде орын алады, ал бұл оқиғалардың салдары да болжап білсіз. Нәтижесінде, сіз болашаққа неғұрлым алыс қарасаңыз, объективті надандық соғұрлым тұрақты түрде жинақталады. Сарапшылардың саяси пайымдауындағы шектеу болжаушылардың когнитивті шектеулерінен емес, олардың болашақты білудегі дәрменсіз объективті надандығынан туындайды.
Біздің қорытындымыз мынадай: пайымдаушыларды олардың ұзақ мерзімді болжамдарының сәтсіздігі үшін айыптауға болмайды. Дегенмен, олар мүмкін емес тапсырманы орындауға тырысқаны және оны орындай алатынына сенгені үшін сынға лайық.
Ұзақ мерзімді болжам жасаудың бос әурешілік екенін анықтағаннан кейін бірнеше жыл өткен соң, Тетлок жұбайы Барбара Меллерспен бірге адамдардың әлемдік оқиғаларды салыстырмалы түрде қысқа мерзімде (әдетте бір жылдан аз уақыт ішінде) қаншалықты дәл болжай алатынын зерттеді. Топ қысқа мерзімді болжам жасау қиын, бірақ мүмкін екенін және кейбір адамдардың (Тетлок пен Меллерс оларды суперболжаушылар деп атады) бұл істе басқаларға, соның ішінде барлау қауымдастығының кәсіби мамандарына қарағанда әлдеқайда жақсы екенін анықтады. Біздің терминдермен айтқанда, олардың жаңа тұжырымдары болашаққа алыс қараған сайын объективті надандықтың арта түсетіні туралы түсінікке сәйкес келеді. Біз суперболжаушылар тақырыбына 21-тарауда ораламыз.
Нашар төрешілер және олардан сәл ғана жақсы модельдер
Тетлоктың алғашқы зерттеулері адамдардың ұзақ мерзімді саяси болжам жасауға жалпы қабілетсіздігін көрсетті. Тіпті болашақты дәл көретін бір адамның табылуының өзі қорытындыны толығымен өзгертер еді. Тапсырманы көптеген сенімді тұлғалар орындап көріп, сәтсіздікке ұшырағаннан кейін ғана оны «мүмкін емес» деп санауға болады. Ақпаратты механикалық біріктіру көбінесе адам пайымдауынан жоғары екенін көрсеткеніміздей, ережелер мен алгоритмдердің болжамдық дәлдігі нәтижелердің табиғатынан қаншалықты болжауға болатынын немесе болмайтынын жақсырақ тексереді.
Алдыңғы тараулар сізде алгоритмдер болжамдық пайымдаулардан әлдеқайда жоғары деген әсер қалдыруы мүмкін. Алайда, бұл әсер жаңылыстыруы мүмкін. Модельдер адамдардан жүйелі түрде жақсырақ, бірақ соншалықты көп емес. Бірдей ақпаратты қолдана отырып, адамдар өте нашар, ал модельдер өте жақсы нәтиже көрсететін жағдайлар туралы дәлелдер іс жүзінде жоқ.
9-тарауда біз механикалық біріктірудің клиникалық пайымдаудан артықшылығын дәлелдейтін 136 зерттеуге шолу жасаған болатынбыз. Бұл артықшылықтың дәлелі шынымен де «ауқымды және жүйелі» болғанымен, нәтижелер арасындағы алшақтық үлкен емес. Шолудағы 93 зерттеу екіұдай шешімдерге (бинарлы шешімдер) арналды және клиникалық мамандар мен формулалардың «сәттілік деңгейін» өлшеді. Орташа зерттеуде клиникалық мамандар жағдайдың 68%-ында, ал формулалар 73%-ында дұрыс болды. 35 зерттеуден тұратын кішігірім топ дәлдік өлшемі ретінде корреляция коэффициентін (екі көрсеткіштің өзара байланыс деңгейі) қолданды. Бұл зерттеулерде клиникалық мамандар нәтижемен 0,32 (PC = 60%) орташа корреляцияға қол жеткізсе, формулалар 0,56 (PC = 69%) көрсеткішіне жетті. Екі өлшем бойынша да формулалар клиникалық мамандардан жүйелі түрде жақсырақ, бірақ механикалық болжамдардың шектеулі жарамдылығы әлі де таңғалдырады. Модельдердің нәтижелері болжау мүмкіндігінің төбесі айтарлықтай төмен екенін өзгертпейді.
Ал жасанды интеллект туралы не айтуға болады? Біз атап өткендей, ЖИ (жасанды интеллект) көбінесе қарапайым модельдерге қарағанда жақсы жұмыс істейді. Дегенмен, көптеген қосымшаларда оның жұмысы әлі де мінсіз емес. Мысалы, 10-тарауда біз талқылаған кепілдікпен босатуды болжау алгоритмін алайық. Біз кепілдіктен бас тартылған адамдардың санын тұрақты ұстай отырып, алгоритм қылмыс деңгейін 24%-ға дейін төмендете алатынын атап өттік. Бұл кепілдік төрешілерінің болжамдарымен салыстырғанда айтарлықтай ілгерілеушілік, бірақ егер алгоритм қай сотталушының қайта қылмыс жасайтынын мінсіз дәлдікпен болжай алса, ол қылмыс деңгейін бұдан да көп төмендетер еді. «Minority Report» (Ерекше пікір) фильміндегі болашақ қылмыстарды алдын ала көру — бұл бекер емес: адам мінез-құлқын болжауда объективті надандықтың үлесі өте үлкен.
Сендхил Муллайнатан мен Зиад Обермейер бастаған тағы бір зерттеу жүрек талмасының диагностикасын модельдеді. Пациенттерде жүрек талмасының белгілері байқалғанда, жедел жәрдем дәрігерлері қосымша тексерулер тағайындау-тағайындамауды шешуі керек. Негізінде, пациенттер тек жүрек талмасының қаупі жоғары болған жағдайда ғана тексерілуі тиіс: өйткені тексеру тек қымбат емес, сонымен қатар инвазивті (ішкі ағзаға араласуды талап ететін) және қауіпті, сондықтан қаупі төмен пациенттер үшін қажет емес. Осылайша, дәрігердің тексеру тағайындау туралы шешімі жүрек талмасы қаупін бағалауды талап етеді. Зерттеушілер осы бағалауды жасау үшін ЖИ моделін жасады. Модель жиырма төрт жүзден астам айнымалыны пайдаланады және жағдайлардың үлкен үлгісіне (1,6 миллион пациенттің 4,4 миллион Medicare [Медикэр - АҚШ-тағы егде адамдарға арналған сақтандыру] сапары) негізделген. Мұндай деректер көлемімен модель объективті надандықтың шегіне жақындауы мүмкін.
ЖИ моделінің дәлдігі дәрігерлерден ерекше жоғары болғаны таңқаларлық емес. Модельдің тиімділігін бағалау үшін модель ең жоғары қауіпті децильге (деректерді он тең бөлікке бөлетін статистикалық көрсеткіш) жатқызған пациенттерді қарастырайық. Бұл пациенттер тексерілгенде, олардың 30%-ында жүрек талмасы болғаны анықталды, ал қауіп деңгейі орташа пациенттердің тек 9,3%-ында ғана осындай жағдай болған. Бұл деңгей әсерлі, бірақ ол да мінсіз емес. Дәрігерлердің жұмыс нәтижесі олардың пайымдауларының кемелсіздігінен гөрі, объективті надандықтың шектеулеріне көбірек байланысты деп қорытынды жасауға болады.
Надандықты мойындамау
Мінсіз болжамның мүмкін еместігін айту арқылы біз анық нәрсені айтып отырғандай көрінуіміз мүмкін. Болашақты болжау мүмкін емес деп мәлімдеу — бұл жаңалық емес. Дегенмен, бұл фактінің анықтығы оның болжамдық асыра сенімділік туралы тұрақты тұжырымдар көрсеткендей, жиі ескерусіз қалатынымен ғана теңесе алады.
Асыра сенімділіктің кең таралғандығы біздің «түйсігіне сенетін» шешім қабылдаушылар арасында жүргізген бейресми сауалнамамызға жаңа қырынан қарауға мүмкіндік береді. Біз адамдардың өздерінің субъективті сенімділік сезімін болжамның жарамдылығы деп жиі қателесетінін атап өттік. Мысалы, 9-тараудағы Натали мен Моника туралы дәлелдерді қарап шыққаннан кейін, сіз қисынды пайымдауға келгенде сезінген ішкі сигналыңыз сізге Наталидің күштірек кандидат екеніне сенімділік берді. Егер сіз бұл болжамға сенімді болсаңыз, сіз жарамдылық иллюзиясына бой алдырдыңыз: сізге берілген ақпаратпен қол жеткізуге болатын дәлдік өте төмен.
Өздерін болжам жасауда мүмкін емес жоғары дәлдікке қабілеттімін деп санайтын адамдар жай ғана асыра сенімді емес. Олар тек өз пайымдауларындағы шу мен бұрмалау қаупін жоққа шығарып қана қоймайды. Сондай-ақ олар өздерін басқалардан жоғары санамайды. Олар іс жүзінде болжау мүмкін емес оқиғалардың болжамдылығына сенеді, бұл белгісіздік шындығын жанама түрде жоққа шығаруды білдіреді. Біздің терминдерімізбен айтқанда, бұл көзқарас надандықты мойындамау болып табылады.
Надандықты мойындамау Мил мен оның ізбасарларын таңғалдырған жұмбаққа жауап қосады: неге оның жолдауы негізінен ескерусіз қалды және неге шешім қабылдаушылар өз түйсігіне сенуді жалғастыруда. Шешім қабылдаушылар өз түйсігін тыңдағанда, олар ішкі сигналды естиді және ол әкелетін эмоционалдық марапатты сезінеді. Жақсы пайымдауға қол жеткізілгені туралы бұл ішкі сигнал — «неге екенін білмей-ақ білудің», яғни сенімділіктің дауысы. Бірақ дәлелдердің шынайы болжамдық күшін объективті бағалау мұндай сенімділік деңгейін сирек ақтайды.
Түйсіктік айқындықтың эмоционалды марапатынан бас тарту оңай емес. Көшбасшылар түйсікті шешім қабылдауға әсіресе белгісіздік жоғары деп қабылдайтын жағдайларда жүгінетіндерін айтады. Фактілер оларға өздері қалайтын түсіну мен сенімділік сезімін бермегенде, олар оны қамтамасыз ету үшін түйсігіне жүгінеді. Надандық ауқымды болған сайын, оны мойындамау соғұрлым тартымды болады.
Надандықты мойындамау тағы бір жұмбақты түсіндіреді. Біз осы жерде келтірген дәлелдермен бетпе-бет келгенде, көптеген көшбасшылар бір қарағанда парадоксальды болып көрінетін қорытынды жасайды. Олардың түйсікке негізделген шешімдері мінсіз болмауы мүмкін, бірақ егер жүйелі баламалар да мінсіз болудан алыс болса, оларды енгізудің қажеті жоқ деп есептейді. Естеріңізге сала кетейін, адамдардың бағалаулары мен қызметкерлердің жұмыс нәтижелері арасындағы орташа корреляция 0,28 (PC = 59%). Сол зерттеуге сәйкес және біз қарастырған дәлелдермен үйлесімді түрде, механикалық болжам жақсырақ болуы мүмкін, бірақ соншалықты көп емес: оның болжамдық дәлдігі 0,44 (PC = 65%). Атқарушы директор сұрауы мүмкін: неге әуре болу керек?
Жауап мынадай: кімді жұмысқа алу керектігі туралы маңызды шешімдерде жарамдылықтың мұндай өсуі үлкен құндылыққа ие. Дәл осы жетекшілер бұдан әлдеқайда аз пайда алу үшін өздерінің жұмыс әдістеріне үнемі маңызды өзгерістер енгізеді. Рационалды түрде олар табысқа ешқашан кепілдік берілмейтінін және өз шешімдерінде табысқа жетудің жоғары мүмкіндігіне ұмтылатындарын түсінеді. Олар сондай-ақ ықтималдықты да түсінеді. Олардың ешқайсысы, егер дәл сондай бағаға 65% ұту мүмкіндігі бар лотерея билетін сатып алу мүмкіндігі болса, 59% ұту мүмкіндігі бар билетті сатып алмас еді.
Мәселе мынада: бұл жағдайдағы «баға» бірдей емес. Түйсіктік пайымдау өзінің марапатымен — ішкі сигналмен бірге келеді. Адамдар өте жоғары дәлдікке ие алгоритмге сенуге дайын, өйткені ол оларға ішкі сигнал беретін сенімділікке тең немесе одан асатын сезім сыйлайды. Бірақ ішкі сигналдың эмоционалды марапатынан бас тарту — егер баламасы жоғары жарамдылыққа иемін деп тіпті айтпайтын қандай да бір механикалық процесс болса, бұл өте жоғары баға.
Бұл бақылау пайымдауды жақсарту үшін маңызды салдарға ие. Механикалық және алгоритмдік болжау әдістерін қолдайтын барлық дәлелдерге қарамастан және болжамдық дәлдіктің шамалы болса да жақсаруының құндылығын көрсететін рационалды есептеулерге қарамастан, көптеген шешім қабылдаушылар өз түйсігін қолдану қабілетінен айыратын шешім қабылдау тәсілдерінен бас тартады. Алгоритмдер мінсіз болмағанша (және көптеген салаларда объективті надандық олардың ешқашан мінсіз болмайтынын көрсетеді) адам пайымдауы ауыстырылмайды. Сондықтан оны жақсарту керек.
Объективті надандық туралы ойлар
«Болжам бар жерде надандық та бар және ол біз ойлағаннан әлдеқайда көп болуы мүмкін. Біз сенетін сарапшылардың дартс лақтырған шимпанзелерден қаншалықты дәлірек екенін тексердік пе? »
«Сіз шынымен білетін бірдеңе үшін емес, ішкі сигналға байланысты түйсігіңізге сенгенде, сіз өзіңіздің объективті надандығыңызды мойындамайсыз».
«Модельдер адамдардан жақсырақ жұмыс істейді, бірақ айырмашылық аса үлкен емес. Көбінесе біз орташа адам пайымдаулары мен олардан сәл ғана жақсырақ модельдерді көреміз. Дегенмен, жақсы болғаны жақсы, ал модельдер жақсырақ».
«Біз бұл шешімдерді қабылдау үшін модельді қолдануға ешқашан дайын болмауымыз мүмкін — бізге жеткілікті сенімділік үшін ішкі сигнал қажет. Сондықтан шешім қабылдау процесінің барынша жақсы болуын қамтамасыз етейік».
12-ТАРАУ
Қалыптылық алқабы
Енді біз кеңірек сұраққа көшеміз: көптеген мәселелер оңай, бірақ басқалары объективті надандыққа толы әлемде біз қалай жайлылыққа қол жеткіземіз? Өйткені, объективті надандық күшті болған жерде, біз біраз уақыттан кейін адамзат істерінде болашақты көретін сиқырлы шарлардың пайдасыздығын сезінуіміз керек. Бірақ біздің әлемдегі тәжірибеміз мұндай емес. Оның орнына, алдыңғы тарауда айтылғандай, біз аз ғана пайдалы ақпаратқа сүйене отырып, болашақ туралы батыл болжамдар жасауға дайын болып қала береміз. Бұл тарауда біз болжау мүмкін болмаған оқиғаларды бәрібір түсінуге болады деген кең таралған әрі қате түсінікті талқылаймыз.
Бұл сенім шын мәнінде нені білдіреді? Біз бұл сұрақты екі тұрғыдан қарастырамыз: әлеуметтік ғылымдардың жүргізілуі және күнделікті өмірдегі оқиғалар тәжірибесі.
Өмірлік траекторияларды болжау
2020 жылы Принстон университетінің социология профессорлары Сара Макланахан мен Мэттью Салганик бастаған 112 зерттеушілер тобы Ұлттық ғылым академиясының еңбектерінде («Proceedings of the National Academy of Sciences») ерекше мақала жариялады. Зерттеушілер әлеуметтік ғалымдардың әлеуметтік жағынан осал отбасылардың өмірлік траекториясында не болатынын қаншалықты түсінетінін анықтауды мақсат етті. Әлеуметтік ғалымдар өз білімдеріне сүйене отырып, отбасы өміріндегі оқиғаларды қаншалықты дәл болжай алады? Нақтырақ айтқанда, социологтар өз зерттеулерінде әдетте жинайтын және қолданатын ақпаратты пайдалана отырып, өмірлік оқиғаларды болжау кезінде қандай дәлдік деңгейіне жете алады? Біздің терминдермен айтқанда, зерттеудің мақсаты — социологтар өз жұмыстарын аяқтағаннан кейін бұл өмірлік оқиғаларда қалатын объективті надандық деңгейін өлшеу болды.
Авторлар материалдарды «Осал отбасылар және баланың амандығы» (Fragile Families and Child Wellbeing Study) атты ауқымды зерттеуден алды, бұл туылғаннан он бес жасқа дейінгі балаларды бақылайтын ұзақ мерзімді зерттеу. Орасан зор деректер базасында бес мыңға жуық баланың отбасы туралы бірнеше мыңдаған ақпарат бар, олардың көпшілігі АҚШ-тың ірі қалаларында некеге тұрмаған ата-аналардан туылған. Деректер баланың ата-әжелерінің білімі мен жұмысы, отбасының барлық мүшелерінің денсаулығы туралы мәліметтер, экономикалық және әлеуметтік мәртебе көрсеткіштері, көптеген сауалнамаларға жауаптар, сондай-ақ когнитивті қабілеттер мен мінез-құлықты тексеру тесттері сияқты тақырыптарды қамтиды. Бұл өте бай ақпарат көзі және әлеуметтік ғалымдар оны тиімді пайдаланды: «Осал отбасылар» зерттеуінің деректеріне негізделген 750-ден астам ғылыми мақала жазылды. Бұл еңбектердің көбі балалар мен олардың отбасылары туралы мәліметтерді мектептегі бағалар мен соттылық сияқты өмірлік нәтижелерді түсіндіру үшін қолданды.
Принстон тобы жүргізген зерттеу бала он бес жасқа толғанда байқалатын алты нәтиженің болжамдылығына назар аударды, соның ішінде жақында үйден шығарылу (эвикция), баланың орташа бағасы (GPA) және үй шаруашылығының материалдық жағдайының жалпы көрсеткіші. Ұйымдастырушылар «ортақ тапсырма әдісі» деп аталатын тәсілді қолданды. Олар зерттеушілер топтарын «Осал отбасылар» зерттеуіндегі әрбір отбасы туралы қолжетімді деректерді пайдалана отырып, таңдалған алты нәтиженің дәл болжамдарын жасауға шақырды. Мұндай сайыс әлеуметтік ғылымдар үшін жаңалық болғанымен, информатикада жиі кездеседі, онда топтар мәтіндерді машиналық аудару немесе көптеген фотосуреттердің ішінен жануарды анықтау сияқты тапсырмалар бойынша жарысады. Бұл жарыстарда жеңімпаз топтың жетістігі белгілі бір уақыттағы технологияның деңгейін анықтайды. Әлеуметтік ғылымдағы болжау тапсырмасында, тез жақсару күтілмейтін жағдайда, жарыста қол жеткізілген ең дәл болжамды осы деректерден нәтиженің болжамдылық деңгейі ретінде пайдалану орынды — басқаша айтқанда, объективті надандықтың қалдық деңгейі.
Бұл тапсырма зерттеушілер арасында үлкен қызығушылық тудырды. Қорытынды есепте әлемдік деңгейдегі үміткерлердің ішінен таңдалған 160 білікті топтың нәтижелері ұсынылды. Таңдалған қатысушылардың көпшілігі өздерін деректер маманы (data scientists) ретінде таныстырып, машиналық оқытуды қолданды.
Жарыстың бірінші кезеңінде қатысушы топтар жалпы іріктеменің жартысы туралы барлық деректерге қол жеткізе алды; бұл деректер алты нәтижені де қамтыды. Олар бұл «оқу деректерін» болжау алгоритмін үйрету үшін пайдаланды. Содан кейін олардың алгоритмдері алгоритмді үйретуге қолданылмаған отбасылардың бақылау үлгісіне қолданылды. Зерттеушілер дәлдікті MSE (орташа квадраттық қателік - болжам мен шындықтың айырмашылығын өлшеу әдісі) арқылы өлшеді: әр жағдай үшін болжау қатесі нақты нәтиже мен алгоритм болжамы арасындағы айырмашылықтың квадраты болды.
Жеңімпаз модельдер қаншалықты жақсы болды? Үлкен деректер жиынтығында оқытылған күрделі машиналық оқыту алгоритмдері, әрине, қарапайым сызықтық модельдердің болжамдарынан асып түсті (және адамдардың болжамдарынан да жақсырақ болды). Бірақ ЖИ модельдерінің өте қарапайым модельден артықшылығы шамалы болды және олардың болжамдық дәлдігі көңіл көншітпейтіндей төмен болып қалды. Үйден шығаруды болжау кезінде ең жақсы модель 0,22 (PC = 57%) корреляциясына қол жеткізді. Осыған ұқсас нәтижелер негізгі күтушінің жұмыстан босатылуы немесе жұмысқа даярлаудан өткені, сондай-ақ баланың «grit» (табандылық — мақсатқа ұмтылудағы жігер мен құштарлықты біріктіретін мінез-құлық сипаты) көрсеткіші бойынша қанша ұпай жинайтыны сияқты басқа да жеке оқиғалар үшін де табылды. Олар үшін корреляция 0,17 мен 0,24 (PC = 55–58%) аралығында болды.
Алты мақсатты нәтиженің екеуі жиынтық көрсеткіштер болды, оларды болжау әлдеқайда оңайырақ еді. Болжамдық корреляциялар (екі құбылыс арасындағы өзара байланыс дәрежесі) баланың GPA көрсеткішімен . 44 (PC = 65% — сәйкестік пайызы), ал алдыңғы он екі айдағы материалдық қиындықтардың жиынтық өлшемімен . 48 (PC = 66%) болды. Бұл өлшем он бір сұраққа негізделді, олардың ішінде «Сіз ешқашан ашықтыңыз ба? » және «Телефон байланысыңыз үзілді ме? » деген сұрақтар болды. Жиынтық өлшемдердің жекелеген нәтижелерге қарағанда болжамды дәлірек беретіні және өздері де оңай болжанатыны кеңінен танымал. Зерттеудің басты қорытындысы — болжамды ақпараттың үлкен көлемі адам өміріндегі жеке оқиғаларды болжау үшін жеткіліксіз, тіпті жиынтық көрсеткіштерді болжаудың өзі айтарлықтай шектеулі.
Бұл зерттеуде байқалған нәтижелер типтік болып табылады және әлеуметтік ғалымдар хабарлайтын көптеген корреляциялар осы диапазонға түседі. Жүз жыл ішінде 8 миллион адамды қамтитын 25 000 зерттеуге жасалған әлеуметтік психологиядағы зерттеулердің ауқымды шолуы «әлеуметтік-психологиялық әсерлер әдетте r [[TERM]корреляция коэффициенті] мәнін . 21-ге тең етеді» деген қорытындыға келді. Ересек адамның бойы мен аяқ өлшемі арасындағы бұрын айтылған . 60 сияқты әлдеқайда жоғары корреляциялар физикалық өлшемдер үшін жиі кездеседі, бірақ әлеуметтік ғылымдарда өте сирек. Мінез-құлық және когнитивтік ғылымдардағы 708 зерттеуге жасалған шолу көрсеткендей, хабарланған корреляциялардың тек 3%-ы ғана . 50 немесе одан жоғары болған.
Егер сіз «статистикалық маңызды» немесе тіпті «жоғары маңызды» деп ұсынылған тұжырымдар туралы оқуға дағдыланған болсаңыз, мұндай төмен корреляция коэффициенттері сізді таңғалдыруы мүмкін. Статистикалық терминдер қарапайым оқырманды жиі шатастырады және «маңызды» (significant) термині бұған ең нашар мысал болуы мүмкін. Тұжырым «маңызды» деп сипатталғанда, біз оның сипаттайтын әсері күшті деп қорытынды жасамауымыз керек. Бұл жай ғана тұжырымның кездейсоқтық нәтижесі болуы екіталай екенін білдіреді. Жеткілікті үлкен таңдама болған жағдайда, корреляция бір мезгілде өте «маңызды» және талқылауға тұрмайтындай аз болуы мүмкін.
Зерттеудегі жеке нәтижелердің шектеулі болжануы түсіну мен болжау арасындағы айырмашылық туралы алаңдатарлық хабар береді. «Fragile Families» (Әлсіз отбасылар) зерттеуі әлеуметтік ғылымның асыл қазынасы болып саналады және көргеніміздей, оның деректері ауқымды зерттеулерде қолданылды. Осы зерттеуді жүргізген ғалымдар өз еңбектері әлсіз отбасылардың өмірін түсінуді ілгерілетті деп сенгені анық. Өкінішке орай, бұл ілгерілеу сезімі жекелеген өмірлердегі жеке оқиғалар туралы нақты болжамдар жасау қабілетімен сәйкес келмеді. Fragile Families сынағы туралы көп авторлы есептің кіріспе аннотациясында қатаң ескерту жасалған: «Зерттеушілер өмір жолдарын түсінеміз деген идея мен болжамдардың ешқайсысының дәл болмағаны туралы фактіні өзара үйлестіруі керек».
Түсіну және болжау
Алайда, әлеуметтік ғылым дискурсында (ғылыми пікірталас ортасында) және күнделікті сөйлесулердің көбінде бір нәрсені түсіну туралы мәлімдеме — сол нәрсенің неден туындайтынын (себебін) түсіну туралы мәлімдеме. Fragile Families зерттеуіндегі мыңдаған айнымалыларды жинап, зерттеген әлеуметтанушылар өздері байқаған нәтижелердің себептерін іздеді. Науқастың неден зардап шегетінін түсінетін дәрігерлер олар қойған диагноз (патология) байқалған симптомдардың себебі болып табылатынын мәлімдейді. Түсіну дегеніміз — себеп-салдар тізбегін сипаттау. Болжам жасау қабілеті — мұндай себеп-салдар тізбегінің шынымен анықталғанының өлшемі. Ал болжамдық дәлдіктің өлшемі болып табылатын корреляция — біз қаншалықты себептілікті түсіндіре алатынымыздың өлшемі.
Бұл соңғы тұжырым, егер сіз қарапайым статистикамен таныс болсаңыз және «корреляция себептілікті білдірмейді» деген жиі қайталанатын ескертуді есте сақтасаңыз, сізді таңғалдыруы мүмкін. Мысалы, балалардың аяқ киім өлшемі мен математикалық қабілеті арасындағы корреляцияны қарастырайық: әрине, бір айнымалы екіншісіне себеп болмайды. Корреляция баланың жасы ұлғайған сайын аяқ киім өлшемі де, математикалық білімі де артатынынан туындайды. Корреляция нақты және ол болжамды негіздейді: егер баланың аяғы үлкен екенін білсеңіз, аяғы кішкентай балаға қарағанда математикалық деңгейі жоғары болады деп болжауыңыз керек. Бірақ бұл корреляциядан себеп-салдарлық байланысты шығармауыңыз керек.
Алайда, корреляция себептілікті білдірмегенімен, себептіліктің міндетті түрде корреляцияны білдіретінін ұмытпауымыз керек. Себеп-салдарлық байланыс бар жерде біз корреляцияны табуымыз керек. Егер сіз ересектер арасында жас пен аяқ киім өлшемі арасында ешқандай корреляция таппасаңыз, онда жасөспірім шақтан кейін жас аяқтың үлкенірек болып өсуіне әсер етпейді және аяқ киім өлшеміндегі айырмашылықтардың себептерін басқа жерден іздеу керек деген қорытындыға сенімді түрде келе аласыз.
Қысқасы, себептілік бар жерде корреляция бар. Демек, себептілік бар жерде біз болжай алуымыз керек — және осы болжамның дәлдігі болып табылатын корреляция біздің себептілікті қаншалықты түсінетініміздің өлшемі болып табылады. Сондықтан Принстон зерттеушілерінің қорытындысы мынадай: әлеуметтанушылардың пәтерден шығару сияқты оқиғаларды . 22 корреляциясымен болжай алу дәрежесі — олардың осы отбасылардың өмір жолдары туралы қаншалықты көп — немесе қаншалықты аз — түсінетінінің көрсеткіші. Объективті надандық тек біздің болжамдарымызға ғана емес, сонымен бірге түсінігімізге де шектеу қояды.
Олай болса, көптеген мамандар өз саласын түсінетіндерін нық сеніммен мәлімдегенде не айтқысы келеді? Олар өздері бақылап отырған құбылыстардың себептері туралы қалай тұжырым жасап, олар туралы нық болжамдар ұсына алады? Қысқасы, неге мамандар — және бәріміз — әлем туралы объективті надандығымызды жете бағаламайтын сияқтымыз?
Себеп-салдарлық ойлау
Егер сіз осы тараудың бірінші бөлімін оқығанда, әлсіз отбасылар арасында пәтерден шығаруға және өмірдің басқа да нәтижелеріне не себеп болатынын өз-өзіңізден сұрасаңыз, сіз біз сипаттаған зерттеушілер сияқты ойлауға көштіңіз. Сіз статистикалық ойлауды (мәліметтер жиынтығына негізделген ойлау) қолдандыңыз: сізді әлсіз отбасылар популяциясы сияқты жиынтықтар және оларды сипаттайтын статистикалық мәліметтер, соның ішінде орташа мәндер, ауытқулар, корреляциялар және т. б. қызықтырды. Сіз жеке жағдайларға назар аудармадыңыз.
Біздің санамызға табиғи түрде келетін ойлаудың басқа режимі мұнда себеп-салдарлық ойлау (causal thinking) деп аталады. Себеп-салдарлық ойлау нақты оқиғалар, адамдар мен объектілер бір-біріне әсер ететін хикаялар жасайды. Себеп-салдарлық ойлауды сезіну үшін өзіңізді көптеген әлеуметтік жағдайы төмен отбасылардың ісін қадағалайтын әлеуметтік қызметкер ретінде елестетіңіз. Сіз жаңа ғана осы отбасылардың бірі — Джонстардың үйден шығарылғанын естідіңіз. Сіздің бұл оқиғаға реакцияңыз Джонстар туралы білетіндеріңізге негізделеді. Отбасының асыраушысы Джессика Джонс бірнеше ай бұрын жұмыстан босатылған болатын. Ол басқа жұмыс таба алмады, содан бері жалдау ақысын толық төлей алмады. Ол жартылай төлемдер жасады, ғимарат менеджеріне бірнеше рет өтініш білдірді, тіпті сізден араласуды сұрады (сіз араластыңыз, бірақ ол көнбеді). Осы мән-жайды ескерсек, Джонстардың пәтерден шығарылуы өкінішті, бірақ таңғаларлық емес. Бұл оқиғалар тізбегінің қисынды соңы, алдын ала белгіленген трагедияның сөзсіз шешімі сияқты көрінеді.
Біз осы «сөзсіздік» сезіміне бой алдырғанда, бәрі қаншалықты оңай басқаша болуы мүмкін екенін — жолдың әр айырығында тағдырдың қалай басқа соқпаққа түсуі мүмкін екенін естен шығарамыз. Джессика жұмысында қалуы мүмкен еді. Ол тез арада басқа жұмыс таба алар еді. Туысы оған көмекке келуі мүмкін еді. Сіз, әлеуметтік қызметкер ретінде, тиімдірек қорғаушы бола алар едіңіз. Ғимарат менеджері түсіністік танытып, отбасына бірнеше апта мұрсат берер еді, бұл Джессикаға жұмыс тауып, жалдау ақысын өтеуге мүмкіндік беретін еді.
Бұл балама хикаялар да негізгі хикая сияқты таңғаларлық емес — егер соңы белгілі болса. Нәтиже қандай болса да (шығару немесе шығармау), ол орын алғаннан кейін, себеп-салдарлық ойлау оны толығымен түсіндіруге болатындай, тіпті болжауға болатындай етіп көрсетеді.
Қалыптылық алқабындағы түсінік
Бұл бақылаудың психологиялық түсіндірмесі бар. Кейбір оқиғалар таңғаларлық: жойқын пандемия, Егіз мұнараларға жасалған шабуыл немесе Понци схемасы болып шыққан жұлдызды хедж-қор. Жеке өмірімізде де кездейсоқ соққылар болады: бейтаныс адамға ғашық болу, жас бауырдың кенеттен қайтыс болуы немесе күтпеген мұра. Басқа оқиғалар, мысалы, екінші сынып оқушысының мектептен белгіленген уақытта оралуы сияқты, белсенді түрде күтіледі.
Бірақ адам тәжірибесінің көп бөлігі осы екі шеткі нүктенің арасында болады. Біз кейде нақты бір оқиғаны белсенді түрде күтетін күйде боламыз, ал кейде таңғаламыз. Бірақ көптеген нәрселер «қалыптылық алқабының» (valley of the normal) кең кеңістігінде орын алады, мұнда оқиғалар толығымен күтілмейді де, аса таңғаларлық та емес. Мысалы, дәл осы сәтте сіз келесі абзацта не болатыны туралы нақты күтуде емессіз. Егер біз кенеттен түрік тіліне ауысып кетсек, сіз таңғалар едіңіз, бірақ біз сізді есеңгіретпей-ақ айта алатын нәрселердің ауқымы өте кең.
Қалыптылық алқабында оқиғалар Джонстардың үйден шығарылуы сияқты өрбиді: олар өткенге көз салғанда (hindsight) қалыпты болып көрінеді, бірақ олар күтілген жоқ және біз оларды болжай алмас едік. Себебі шындықты түсіну процесі өткенге бағытталған. Белсенді түрде күтілмеген оқиға (Джонстар отбасының үйден шығарылуы) жадымыздан ықтимал себепті (қиын жұмыс нарығы, қатал менеджер) іздеуді бастайды. Жақсы хикая табылғанда іздеу тоқтайды. Кері нәтиже болған жағдайда, іздеу дәл сондай дәлелді себептерді (Джессика Джонстың табандылығы, түсінікті менеджер) табар еді.
Бұл мысалдар көрсеткендей, қалыпты хикаядағы көптеген оқиғалар сөзбе-сөз өздігінен түсіндіріледі. Сіз үйден шығару хикаясының екі нұсқасындағы ғимарат менеджерінің шын мәнінде бір адам емес екенін байқаған боларсыз: біріншісі қатыгез, екіншісі мейірімді болды. Бірақ менеджердің мінезі туралы сіздегі жалғыз дерек — оның мінез-құлқы көрсеткен әрекеті ғана. Ол туралы қазіргі білетінімізді ескерсек, оның әрекеті үйлесімді болып көрінеді. Оқиғаның орын алуының өзі сізге оның себебін айтып береді.
Осылайша күтпеген, бірақ таңғаларлық емес нәтижені түсіндіргенде, ақыр соңында жеткен мақсат әрқашан мағыналы болады. Хикаяны түсіну дегеніміз осы және бұл шындықты — өткенге көз салғанда — болжауға болатындай етіп көрсетеді. Оқиға орын алған сайын өзін-өзі түсіндіретіндіктен, біз оны алдын ала білуге болатын еді деген елеске берілеміз.
Кеңірек айтқанда, біздің әлемді түсіну сезіміміз байқаған оқиғаларымызды түсіндіретін хикаялар құрастырудағы ерекше қабілетімізге байланысты. Себептерді іздеу әрқашан дерлік сәтті аяқталады, өйткені себептерді әлем туралы фактілер мен нанымдардың шексіз қорынан алуға болады. Мысалы, кешкі жаңалықтарды тыңдайтын кез келген адам білетіндей, қор нарығының бірде-бір ірі қозғалысы түсіндірусіз қалмайды. Бір жаңалықтар ағыны индекстердің төмендеуін («мазасыз инвесторлар жаңалықтарға алаңдаулы! ») немесе көтерілуін («сабырлы инвесторлар оптимистік көңіл-күйде! ») бірдей «түсіндіре» алады.
Анық себепті іздеу сәтсіз аяқталғанда, біздің алғашқы әрекетіміз — әлем туралы моделіміздегі бос орынды толтыру арқылы түсініктеме жасау. Біз бұрын білмеген фактіні осылай тұжырымдаймыз (мысалы, менеджер ерекше мейірімді адам болған). Тек біздің әлем моделін нәтижені тудыру үшін өзгерту мүмкін болмаған кезде ғана, біз бұл нәтижені таңғаларлық деп белгілеп, оны тереңірек түсіндіруді іздей бастаймыз. Нағыз таңғалыс тек әдеттегі өткенді түсіну сәтсіздікке ұшырағанда ғана болады.
Шындықтың осы үздіксіз себеп-салдарлық интерпретациясы — біздің әлемді «түсіну» тәсіліміз. Өмірдің өрбуін түсіну сезімі қалыптылық алқабындағы өткенді түсінудің тұрақты ағынынан тұрады. Бұл сезім түбегейлі себеп-салдарлы болып келеді: жаңа оқиғалар белгілі болғаннан кейін баламаларды жояды және хикаяда белгісіздікке орын аз қалады. Өткенді түсіну туралы классикалық зерттеулерден білетініміздей, тіпті субъективті белгісіздік біраз уақыт бойы болса да, белгісіздік шешілген кезде ол туралы естеліктер негізінен өшіріледі.
Ішкі және сыртқы көзқарас
Біз оқиғалар туралы ойлаудың екі тәсілін — статистикалық және себеп-салдарлық тәсілдерді қарама-қарсы қойдық. Себеп-салдарлық режим оқиғаларды нақты уақыт режимінде қалыпты немесе қалыптан тыс деп жіктеу арқылы бізді көптеген күш жұмсайтын ойлаудан сақтайды. Қалыптан тыс оқиғалар қоршаған ортадан да, жадымыздан да тиісті ақпаратты іздеу үшін қымбат күш-жігерді тез жұмылдырады. Белсенді күту — бір нәрсенің болуын мұқият күту — де күш-жігерді талап етеді. Керісінше, қалыптылық алқабындағы оқиғалар ағыны аз ақыл-ой еңбегін қажет етеді. Көршіңіз жолыққанда жымиуы мүмкін немесе ойланып тұрғандай болып, жай ғана басын изеуі мүмкін — егер бұл екі жағдай да бұрын жиі болып тұрса, олардың ешқайсысы көп назар аудармайды. Егер жымиыс ерекше кең болса немесе басын изеуі ерекше салғырт болса, сіз жадыңызды ақтарып, ықтимал себепті іздей бастауыңыз мүмкін. Себеп-салдарлық ойлау қалыптан тыс оқиғаларды анықтау үшін қажетті қырағылықты сақтай отырып, қажетсіз күш-жігерден аулақ болуға көмектеседі.
Керісінше, статистикалық ойлау күш-жігерді қажет етеді. Ол тек 2-жүйе (баяу, саналы ойлау режимі) ғана бере алатын зейін ресурстарын талап етеді. Қарапайым деңгейден жоғары статистикалық ойлау арнайы дайындықты да қажет етеді. Ойлаудың бұл түрі жиынтықтардан басталады және жеке жағдайларды кеңірек санаттардың мысалы ретінде қарастырады. Джонстардың үйден шығарылуы нақты оқиғалар тізбегінің нәтижесі ретінде емес, Джонстармен болжамдық сипаттамалары ұқсас жағдайларды бұрынғы бақылаулар негізінде статистикалық тұрғыдан ықтимал (немесе екіталай) нәтиже ретінде қарастырылады.
Осы екі көзқарас арасындағы айырмашылық — бұл кітаптың қайталанатын тақырыбы. Бір жағдай туралы себеп-салдарлық ойлауға сену — болжамды қателіктердің көзі. Статистикалық көзқарасты, біз оны «сыртқы көзқарас» (outside view) деп те атаймыз, қабылдау — осы қателіктерден аулақ болудың жолы.
Осы сәтте бізге тек себеп-салдарлық режимнің бізге әлдеқайда табиғи келетінін баса айту керек. Тіпті статистикалық ретінде қарастырылуы керек түсініктемелер де оңай себеп-салдарлық хикаяларға айналады. «Олар тәжірибесіздіктен сәтсіздікке ұшырады» немесе «олар керемет көшбасшының арқасында табысқа жетті» деген тұжырымдарды қарастырыңыз. Тәжірибесіз командалар табысқа жеткен және керемет көшбасшылар сәтсіздікке ұшыраған кері мысалдарды ойлау сізге оңай болар еді. Тәжірибе мен кереметтіктің табыспен корреляциясы жақсы дегенде орташа, ал мүмкін төмен. Соған қарамастан, себеп-салдарлық байланыс оңай орнатылады. Себептілік ақылға қонымды жерде, біздің санамыз кез келген корреляцияны, мейлі ол қаншалықты төмен болса да, себеп-салдарлық және түсіндіруші күшке оңай айналдырады. Керемет көшбасшылық табыстың қанағаттанарлық түсіндірмесі ретінде, ал тәжірибесіздік сәтсіздіктің түсіндірмесі ретінде қабылданады.
Егер балама — әлемімізді түсінуден бас тарту болса, мінсіз емес түсініктемелерге сену сөзсіз болуы мүмкін. Алайда, себеп-салдарлық ойлау мен өткенді түсіну елесі болашақ туралы тым сенімді болжамдарға ықпал етеді. Көріп отырғанымыздай, себеп-салдарлық ойлауға басымдық беру шуды (noise — пайымдаулардағы кездейсоқ ауытқулар) қателік көзі ретінде ескермеуге де ықпал етеді, өйткені шу — бұл түбегейлі статистикалық ұғым.
Себеп-салдарлық ойлау бізге біз ойлағаннан әлдеқайда аз болжанатын әлемді түсінуге көмектеседі. Ол сондай-ақ неге біз әлемді іс жүзіндегіден әлдеқайда болжамды деп санайтынымызды түсіндіреді. Қалыптылық алқабында таңғалыстар да, қарама-қайшылықтар да жоқ. Болашақ өткен шақ сияқты болжамды болып көрінеді. Ал шу естілмейді де, көрінбейді де.
Түсіну шектеулері туралы сөз қозғағанда:
«Адам істерінде . 20 шамасындағы корреляциялар (PC = 56%) өте жиі кездеседі».
«Корреляция себептілікті білдірмейді, бірақ себептілік корреляцияны білдіреді».
«Қалыпты оқиғалардың көбі күтілмейді де, таңғалдырмайды да және олар ешқандай түсіндіруді қажет етпейді».
«Қалыптылық алқабында оқиғалар күтілмейді де, таңғалдырмайды да — олар жай ғана өздерін түсіндіреді».
«Біз мұнда не болып жатқанын түсінеміз деп ойлаймыз, бірақ оны болжай алар ма едік? »
IV БӨЛІМ
Шу қалай пайда болады
Шудың және бұрмаланудың (bias — жүйелі қателік) төркіні неде? Біздің пайымдауларымыздың өзгермелілігіне және оларға әсер ететін ортақ қателіктерге қандай психикалық механизмдер себеп болады? Қысқасы, біз шу психологиясы туралы не білеміз? Біз қазір осы сұрақтарға көшеміз.
Алдымен біз жылдам 1-жүйе (автоматты, интуитивті ойлау) ойлауының кейбір операциялары көптеген пайымдау қателіктеріне қалай жауапты екенін сипаттаймыз. 13-тарауда біз 1-жүйе кеңінен сүйенетін үш маңызды пайымдау эвристикасын (күрделі сұрақтарға жауап іздеуді жеңілдететін тәсілдер) ұсынамыз. Біз бұл эвристикалардың қалай болжамды, бағытты қателіктерге (статистикалық бұрмалану), сондай-ақ шуға себеп болатынын көрсетеміз.
14-тарау «сәйкестендіруге» (matching) — 1-жүйенің ерекше операциясына — арналған және оның тудыруы мүмкін қателіктерін талқылайды.
15-тарауда біз барлық пайымдаулардың ажырамас аксессуарына — пайымдаулар жасалатын шкалаға көшеміз. Біз сәйкес шкаланы таңдау жақсы пайымдау үшін алғышарт екенін және нашар анықталған немесе жеткіліксіз шкалалар шудың маңызды көзі екенін көрсетеміз.
16-тарау шудың ең қызықты түрі болуы мүмкін нәрсенің психологиялық көзін зерттейді: әртүрлі адамдардың әртүрлі жағдайларға беретін жауаптарының үлгілері. Жеке тұлғалық қасиеттер сияқты, бұл үлгілер кездейсоқ емес және уақыт өте келе негізінен тұрақты болады, бірақ олардың әсерлерін болжау оңай емес.
Соңында, 17-тарауда біз шу және оның құрамдас бөліктері туралы білгендерімізді қорытындылаймыз. Бұл зерттеу бізді бұрын көтерген жұмбаққа жауап ұсынуға итермелейді: неге шу, барлық жерде кездесетініне қарамастан, сирек маңызды мәселе ретінде қарастырылады?
13-ТАРАУ
Эвристикалар, бұрмаланулар және шу
Бұл кітап интуитивті адам пайымдауы туралы жарты ғасырлық зерттеулерді, яғни эвристикалар және бұрмаланулар бағдарламасын кеңейтеді. Бұл зерттеу бағдарламасының алғашқы төрт онжылдығы Thinking, Fast and Slow (Баяу ойлап, тез шешім қабылда) кітабында қаралды, онда интуитивті ойлаудың кереметтері мен кемшіліктерін түсіндіретін психологиялық механизмдер зерттелді. Бағдарламаның орталық идеясы — қиын сұрақ қойылған адамдар эвристикалар (heuristic — күрделі сұрақтарға жауап іздеуді жеңілдететін қарапайым тәсілдер) деп аталатын қарапайымдату операцияларын қолданады. Жалпы алғанда, 1-жүйе ойлауы деп те аталатын жылдам, интуитивті ойлау арқылы туындайтын эвристикалар өте пайдалы және барабар жауаптар береді. Бірақ кейде олар біз жүйелі, болжамды пайымдау қателіктері деп сипаттаған бұрмалануларға әкеледі.
Эвристикалар және бұрмаланулар бағдарламасы адамдардың айырмашылықтарына емес, олардың ортақ қасиеттеріне назар аударды. Ол пайымдау қателіктерін тудыратын процестердің кеңінен таралғанын көрсетті. Осы тарихтың әсерінен болар, психологиялық бұрмалану ұғымымен таныс адамдар ол әрқашан статистикалық бұрмалануды тудырады деп есептейді. Біз бұл кітапта бұл терминді шындықтан негізінен бір бағытта ауытқитын өлшемдерді немесе пайымдауларды білдіру үшін қолданамыз. Шынында да, психологиялық бұрмаланулар кеңінен таралған кезде статистикалық бұрмалануды тудырады. Алайда, бағалаушылар әртүрлі тәсілдермен немесе әртүрлі дәрежеде бұрмаланған кезде, психологиялық бұрмаланулар жүйелік шуды тудырады. Әрине, олар статистикалық бұрмалануды немесе шуды тудырса да, психологиялық бұрмаланулар әрқашан қателік тудырады.
Бұрмалануларды диагностикалау Пайымдау бұрмаланулары көбінесе шынайы мәнге сілтеме жасау арқылы анықталады. Егер қателіктер негізінен басқа емес, бір бағытта болса, болжамдық пайымдауларда бұрмалану бар. Мысалы, адамдар жобаны аяқтауға қанша уақыт кететінін болжағанда, олардың бағалауларының орташа мәні әдетте оларға іс жүзінде қажет болатын уақыттан әлдеқайда төмен болады. Бұл таныс психологиялық бұрмалану <span data-term="true">жоспарлау қателігі</span> (planning fallacy — жоба уақытын тым аз деп бағалау үрдісі) ретінде белгілі.
Жиі жағдайда бағалауларды салыстыруға болатын шынайы мән болмайды. Статистикалық ауытқуды тек шынайы мән белгілі болғанда ғана анықтауға болатынын ескерсек, шындық белгісіз болғанда психологиялық ауытқуларды қалай зерттеуге болады деген сұрақ туындауы мүмкін. Жауап мынада: зерттеушілер психологиялық ауытқуды бағалауға әсер етпеуі тиіс фактордың оған статистикалық әсері бар екенін немесе, керісінше, әсер етуі тиіс фактордың әсер етпейтінін бақылау арқылы растайды.
Осы әдісті сипаттау үшін тирдегі ату мысалына қайта оралайық. А және Б командалары өз атуларын аяқтады делік, біз нысананың артқы жағына қарап тұрмыз (12-сурет). Бұл мысалда нысананың ортасы (шынайы мән) қайда екенін білмейсіз. Сонымен қатар, екі команданың нысана ортасына қатысты қаншалықты ауытқығанын да білмейсіз. Алайда, сізге 1-панельде екі команда бір нысананы көздегені, ал 2-панельде А командасы бір нысананы, Б командасы басқа нысананы көздегені айтылды.
Нысананың өзі көрінбесе де, екі панель де жүйелі ауытқудың дәлелін ұсынады. 1-панельде екі команданың ату нәтижелері бірдей болуы керек болса да, олар әртүрлі. Бұл көрініс екі топ инвестордың мазмұны бірдей, бірақ қаріпі мен қағазы әртүрлі бизнес-жоспарларды оқығандағы экспериментке ұқсайды. Егер осы маңызды емес бөлшектер инвесторлардың шешіміне әсер етсе, онда психологиялық ауытқу бар. Көркем қаріп пен жылтыр қағазға қызыққан инвесторлар тым оптимистік пе, әлде қарапайым нұсқаны оқығандар тым пессимистік пе, біз оны білмейміз. Бірақ олардың бағалаулары бірдей болуы керек болса да, әртүрлі екенін білеміз.

12-СУРЕТ: Ауытқуды тексеру экспериментіндегі нысананың артқы көрінісі
2-панель қарама-қайшы құбылысты көрсетеді. Командалар әртүрлі нысаналарды көздегендіктен, оқтардың шоғыры бөлек болуы керек еді, бірақ олар бір нүктеде шоғырланған. Мысалы, екі топқа 4-тараудағы Майкл Гамбарди туралы сұрақ қойылды делік, бірақ кішкене өзгеріспен. Бір топтан Гамбардидің екі жылдан кейін өз қызметінде қалу ықтималдығын бағалау сұралса, екінші топтан оның үш жылдан кейін қалу ықтималдығын бағалау сұралады. Екі топ әртүрлі қорытындыға келуі тиіс, себебі екі жылға қарағанда үш жыл ішінде жұмыстан айырылудың жолдары көбірек екені анық. Алайда, зерттеулер көрсеткендей, екі топтың ықтималдық бағалауларында айырмашылық өте аз болады немесе мүлдем болмайды. Жауаптар анық түрде әртүрлі болуы керек еді, бірақ олай емес. Бұл бағалауға әсер етуі тиіс фактордың еленбейтінін көрсетеді. (Бұл психологиялық ауытқу scope insensitivity (ауқымға сезімталдықтың жоқтығы — мөлшер немесе көлем өзгерісіне бағалаудың жауап бермеуі) деп аталады).
Жүйелі бағалау қателіктері көптеген салаларда дәлелденген және bias (ауытқу) термині қазіргі таңда бизнес, саясат, заң салаларында кеңінен қолданылады. Бұл сөздің мағынасы кең. Біз қолданып жүрген когнитивтік анықтамадан (психологиялық механизмге және сол механизм тудыратын қателікке сілтеме жасайтын) бөлек, бұл сөз жиі біреудің белгілі бір топқа (мысалы, гендерлік немесе нәсілдік ауытқулар) қарсы екенін білдіру үшін де қолданылады. Сондай-ақ, бұл біреудің мүдделер қақтығысы немесе саяси көзқарасы салдарынан белгілі бір қорытындыны жақтайтынын білдіруі мүмкін. Біз бұл ауытқу түрлерін бағалау қателіктерінің психологиясын талқылауға қосамыз, себебі барлық психологиялық ауытқулар статистикалық ауытқуды да, шуды да тудырады.
Біз бұл терминді қолданудың бір түріне үзілді-кесілді қарсымыз. Ол жағдайда шығыны көп сәтсіздіктер белгісіз «ауытқуларға» жатқызылады, ал қатені мойындау «шешім қабылдаудағы ауытқуларды жою үшін аянбай еңбек етеміз» деген уәделермен сүйемелденеді. Мұндай мәлімдемелер «қателіктер жіберілді» және «біз жақсырақ жұмыс істеуге тырысамыз» дегеннен басқа ештеңені білдірмейді. Әрине, кейбір сәтсіздіктер нақты психологиялық ауытқулармен байланысты болжамды қателіктерден туындайды және біз бағалау мен шешім қабылдаудағы ауытқуларды (және шуды) азайтуға бағытталған шаралардың тиімділігіне сенеміз. Бірақ әрбір жағымсыз нәтижені ауытқулардан көру — құнсыз түсініктеме. Біз bias сөзін тек нақты, анықтауға болатын қателіктер мен оларды тудыратын механизмдер үшін ғана қолдануды ұсынамыз.
Алмастыру
Эвристикалық процесті сезіну үшін, эвристика мен ауытқулар тәсілінің бірнеше маңызды тақырыптарын көрсететін келесі сұраққа жауап беріп көріңіз. Әдеттегідей, өз жауаптарыңызды дайындасаңыз, мысалдан көбірек пайда аласыз.
Билл отыз үш жаста. Ол ақылды, бірақ қиялы шектеулі, ұқыпты және жалпы алғанда өмірге құлшынысы төмен адам. Мектепте математикадан мықты болғанымен, әлеуметтік ғылымдар мен гуманитарлық пәндерден әлсіз болған.
Төменде Биллдің қазіргі жағдайына қатысты сегіз мүмкіндік берілген.
Тізімді қарап шығып, ең ықтимал деп санайтын екеуін таңдаңыз.

Билл — хобби ретінде покер ойнайтын дәрігер.

Билл — архитектор.

Билл — бухгалтер.

Билл — хобби ретінде джаз ойнайды.

Билл — хобби ретінде серфингпен айналысады.

Билл — репортер.

Билл — хобби ретінде джаз ойнайтын бухгалтер.

Билл — хобби ретінде тауға шығады.
Енді тізімге қайта оралып, Билл сол санаттағы типтік адамға ең қатты ұқсайтын екі санатты таңдаңыз. Алдыңғы таңдауларыңызбен бірдей немесе басқа санаттарды таңдауыңызға болады.
Сіз ең ықтимал және ең ұқсас санаттар ретінде бірдей нұсқаларды таңдағаныңызға біз толық сенімдіміз. Бұлай сенімді болуымыздың себебі — көптеген эксперименттер адамдардың осы екі сұраққа бірдей жауап беретінін көрсетті. Бірақ ұқсастық пен ықтималдық шын мәнінде мүлдем бөлек нәрселер. Мысалы, өзіңізден сұрап көріңізші, келесі тұжырымдардың қайсысы қисындырақ?

Билл менің түсінігімдегі джазды хобби ретінде ойнайтын адам бейнесіне сай келеді.

Билл менің түсінігімдегі джазды хобби ретінде ойнайтын бухгалтер бейнесіне сай келеді.
Бұл тұжырымдардың ешқайсысы мінсіз емес, бірақ біреуі екіншісіне қарағанда анық жақсырақ. Биллдің жай ғана джаз ойнайтын адамға қарағанда, джаз ойнайтын бухгалтермен ортақ қасиеттері көбірек. Енді мынаны ойлап көріңіз: қайсысы ықтималырақ?

Билл хобби ретінде джаз ойнайды.

Билл — хобби ретінде джаз ойнайтын бухгалтер.
Сіз екінші жауапты таңдағыңыз келуі мүмкін, бірақ логика бұған жол бермейді. Биллдің джаз ойнау ықтималдығы оның джаз ойнайтын бухгалтер болу ықтималдығынан міндетті түрде жоғары болуы керек. Венн диаграммаларын (жиынтықтардың қиылысуын көрсететін сызбалар) еске түсіріңіз! Егер Билл джаз ойнаушы әрі бухгалтер болса, ол міндетті түрде джаз ойнаушы болып табылады. Сипаттамаға бөлшектерді қосу оны тек аз ықтимал етеді, бірақ ол сипаттаманы репрезентативті, яғни қазіргі жағдайдағыдай «сәйкесірек» ете алады.
Бағалау эвристикасы теориясы адамдардың кейде қиын сұраққа жауап беру үшін жеңілірек сұрақтың жауабын қолданатынын айтады. Сонымен, қай сұраққа жауап беру оңайырақ: «Билл типтік әуесқой джаз ойнаушыға қаншалықты ұқсайды? » әлде «Биллдің әуесқой джаз ойнаушы болу ықтималдығы қандай? » Әрине, ұқсастық туралы сұрақ оңайырақ, сондықтан адамдардан ықтималдықты бағалауды сұрағанда, олар осы сұраққа жауап береді.
Сіз қазір «эвристика мен ауытқулар» бағдарламасының негізгі идеясын сезіндіңіз: қиын сұраққа жауап берудің эвристикасы — жеңілірек сұрақтың жауабын табу. Бір сұрақты екіншісімен алмастыру психологиялық ауытқулар деп аталатын болжамды қателіктерді тудырады.
Бұл ауытқу түрі Билл мысалында анық көрінеді. Ықтималдықты бағалаудың орнына ұқсастықты бағалау қолданылғанда қателіктердің болуы заңды, өйткені ықтималдық арнайы логикамен шектеледі. Атап айтқанда, Венн диаграммалары ұқсастыққа емес, тек ықтималдыққа қатысты. Сондықтан көптеген адамдар болжамды логикалық қателік жібереді.
Статистикалық қасиеттерді елемеудің тағы бір мысалы ретінде 4-тараудағы Гамбарди туралы сұрақты қалай ойлағаныңызды еске түсіріңіз. Егер сіз көпшілік сияқты болсаңыз, Майкл Гамбардидің табысқа жету мүмкіндігін тек ол туралы берілген мәліметтерге сүйеніп бағаладыңыз. Содан кейін оның сипаттамасын табысты бас директордың (CEO) бейнесіне сәйкестендіруге тырыстыңыз.
Кездейсоқ таңдалған бас директордың екі жылдан кейін сол қызметте қалу ықтималдығын ескеру ойыңызға келді ме? Сірә, жоқ. Сіз бұл base-rate information (базалық мөлшер туралы ақпарат — қарастырылып отырған оқиғаның жалпы статистикалық жиілігі) ретінде бас директор болып қалудың қиындық деңгейін түсіне аласыз. Егер бұл тәсіл оғаш көрінсе, белгілі бір студенттің тесттен өту ықтималдығын қалай бағалайтыныңызды ойлаңыз. Тесттен өтпей қалған студенттердің үлесі маңызды ақпарат, себебі ол тесттің қаншалықты қиын екенін көрсетеді. Сол сияқты, бас директорлардың жұмыста қалуының базалық мөлшері Гамбарди мәселесі үшін де маңызды. Бұл екі сұрақ та біз «сыртқы көзқарас» деп атаған тәсілге жатады: бұл көзқарасты қолданғанда, сіз студентті немесе Гамбардиді ұқсас жағдайлар тобының бір мүшесі ретінде қарастырасыз. Сіз нақты жағдай туралы себеп-салдарлық тұрғыдан ойлаудың орнына, сол топ туралы статистикалық тұрғыдан ойлайсыз.
Сыртқы көзқарасты қолдану үлкен айырмашылық тудырып, елеулі қателіктердің алдын алады. Бірнеше минуттық зерттеу АҚШ компанияларындағы бас директорлардың ауысуы жыл сайын шамамен 15% құрайтынын көрсетеді. Бұл статистика жаңадан келген орташа бас директордың екі жылдан кейін де өз орнында қалу ықтималдығы шамамен 72% екенін білдіреді. Әрине, бұл сан тек бастапқы нүкте ғана және Гамбарди жағдайының ерекшеліктері сіздің соңғы бағалауыңызға әсер етеді. Бірақ егер сіз тек Гамбарди туралы айтылғандарға ғана назар аударсаңыз, онда маңызды ақпаратты елеусіз қалдырдыңыз. (Ашығын айтсақ: біз Гамбарди жағдайын «шулы бағалауды» көрсету үшін жаздық; бірақ бұл жерде сипатталған base-rate neglect (базалық мөлшерді елемеу — жалпы статистикалық деректерді ескермей, тек нақты ақпаратқа сүйену) ауытқуының жарқын мысалы екенін түсінуімізге бірнеше апта қажет болды. Базалық мөлшер туралы ойлау бұл кітаптың авторлары үшін де басқалар сияқты автоматты түрде болатын нәрсе емес).
Бір сұрақты екіншісімен алмастыру тек ұқсастық пен ықтималдықпен шектелмейді. Тағы бір мысал — жиілікті бағалауды белгілі бір жағдайлардың еске қаншалықты оңай түсетінімен (әсерімен) алмастыру. Мысалы, ұшақ апаттары немесе дауылдар туралы жаңалықтардан кейін олардың қауіптілігін сезіну деңгейі уақытша көтеріледі. Теория жүзінде қауіпті бағалау ұзақ мерзімді орташа көрсеткішке негізделуі тиіс. Шын мәнінде, соңғы оқиғаларға көбірек мән беріледі, себебі олар еске тезірек түседі. Жиілікті бағалауды мысалдардың еске қаншалықты оңай түсетінімен алмастыру availability heuristic (қолжетімділік эвристикасы — шешім қабылдағанда ойға бірінші келген ақпаратқа артық сенім арту) деп аталады.
Қиын бағалауды жеңіл бағалаумен алмастыру өте жиі кездеседі. Жеңілірек сұраққа жауап беруді сізді тығырыққа тірейтін сұраққа жауап берудің әмбебап әдісі деп санауға болады. Мына сұрақтардың әрқайсысын жеңілірек балама арқылы қалай жауап беретінімізді ойлап көріңізші:
Негізгі сұрақ | Жеңіл алмастырушы сұрақ :--- | :--- Мен климаттың өзгеруіне сенемін бе? | Оның бар екенін айтатын адамдарға сенемін бе? Бұл хирург білікті деп ойлаймын ба? | Бұл адам сенімді әрі беделді сөйлей ме? Жоба кестеге сай аяқтала ма? | Ол қазір кестеге сай ма? Ядролық энергия қажет пе? | «Ядролық» деген сөзден сескенемін бе? Мен жалпы өз өміріме ризамын ба? | Дәл қазір көңіл-күйім қандай?
Сұрақ қандай болса да, бір сұрақты екіншісімен алмастыру дәлелдемелердің әртүрлі аспектілеріне тиісті мән бермейтін жауапқа әкеледі, ал дәлелдерді қате өлшеу міндетті түрде қателікке соқтырады. Мысалы, өмірге қанағаттану туралы сұраққа толық жауап беру тек қазіргі көңіл-күйден де көп нәрсені ескеруді талап етеді, бірақ зерттеулер көңіл-күйге шын мәнінде тым көп мән берілетінін көрсетеді.
Сол сияқты, ұқсастықты ықтималдықпен алмастыру базалық мөлшерлерді елемеуге әкеледі. Сондай-ақ, бизнес-жоспар ұсынылған құжаттың эстетикасындағы маңызды емес өзгерістерге компанияның құнын бағалау кезінде аз мән берілуі керек немесе мүлдем мән берілмеуі керек. Олардың бағалауға тигізетін кез келген әсері дәлелдерді қате өлшеуді көрсетеді және қателік тудырады.
Қорытындыға негізделген ауытқулар
«Жұлдызды соғыстар» сериясының үшінші фильмі «Джедайдың оралуы» сценарийін әзірлеудің маңызды сәтінде серияның негізін қалаушы Джордж Лукас өзінің әріптесі Лоуренс Казданмен қызу пікірталасқа түсті. Каздан Лукасқа: «Меніңше, сен Люкті өлтіріп, оның орнын Лея басуы керек деп ойлаймын», — деп кеңес берді. Лукас бұл идеяны бірден қабылдамады. Каздан егер Люк тірі қалса, басқа басты кейіпкер өлуі керек екенін айтты. Лукас тағы да келіспей: «Адамдарды оңды-солды өлтіруге болмайды», — деді. Каздан киноның табиғаты туралы шынайы уәж келтірді. Ол Лукасқа: «Егер жол бойында жақсы көрген адамыңнан айырылсаң, фильмнің эмоционалдық салмағы артады; бұл саяхаттың әсері күштірек болады», — деп түсіндірді.
Лукастың жауабы тез әрі кесіп айтылды: «Маған бұл ұнамайды және мен бұған сенбеймін».
Бұл жердегі ойлау процесі джаз ойнайтын бухгалтер Билл туралы ойлағандағыдан мүлдем басқаша көрінеді. Лукастың жауабын қайта оқыңыз: «Ұнамау» «сенбеуден» бұрын тұр. Лукастың Казданның ұсынысына автоматты реакциясы болды. Бұл реакция (тіпті ол дұрыс болып шықса да) оның бағалауына түрткі болды.
Бұл мысал біз conclusion bias (қорытындыға негізделген ауытқу — алдын ала қабылданған шешімге сәйкес дәлелдер іздеу) немесе prejudgment (алдын ала үкім кесу) деп атайтын ауытқудың басқа түрін көрсетеді. Лукас сияқты, біз де бағалау процесін белгілі бір қорытындыға келуге бейімділікпен бастаймыз. Олай істегенде, біз жылдам, интуитивті «1-жүйе» ойлауымызға қорытынды ұсынуға мүмкіндік береміз. Не біз сол қорытындыға бірден секіріп, ақпаратты жинау және біріктіру процесін аттап өтеміз, не алдын ала үкімімізді қолдайтын дәлелдер табу үшін саналы ойлауды — «2-жүйені» жұмылдырамыз. Мұндай жағдайда дәлелдер таңдамалы және бұрмаланған болады: confirmation bias (растауға бейімділік) және desirability bias (қалаулылыққа бейімділік) салдарынан біз өзіміз сенетін немесе шын болғанын қалайтын бағалауды қолдау үшін ақпаратты таңдап жинауға және түсіндіруге бейім боламыз.
Адамдар көбінесе өз бағалауларына қисынды ақтаулар ойлап табады және оларды өз нанымдарының себебі деп санайды. Алдын ала үкімнің рөлін тексерудің жақсы әдісі — біздің сенімімізді қолдайтын дәлелдер кенеттен жарамсыз болып шыққанын елестету. Мысалы, Каздан Лукасқа «Адамдарды оңды-солды өлтіруге болмайды» дегеннің салмақты уәж емес екенін айтуы мүмкін еді. «Ромео мен Джульеттаның» авторы Лукаспен келіспес еді, ал егер «Сопрано кланы» мен «Тақтар ойынының» авторлары кейіпкерлерді өлтірмеуге шешім қабылдаса, екі шоу да бірінші маусымда-ақ жабылып қалар еді. Бірақ біз күшті қарсы уәж Лукастың пікірін өзгертпейтініне бәс тіге аламыз. Оның орнына ол өз бағалауын қолдайтын басқа уәждер тауып алар еді. (Мысалы, «Жұлдызды соғыстардың жөні бөлек»).
Алдын ала үкімдер біз қараған кез келген жерде кездеседі. Лукастың реакциясы сияқты, олардың көбінесе эмоционалдық құрамдас бөлігі болады. Психолог Пол Словик мұны affect heuristic (аффект эвристикасы — шешім қабылдағанда адамның эмоциялары мен ішкі сезімдеріне сүйенуі) деп атайды: адамдар өз сезімдеріне сүйене отырып не ойлайтынын анықтайды. Біз өзіміз қолдайтын саясаткерлердің барлық қасиетін ұнатамыз, ал ұнатпайтын саясаткерлердің тіпті түрі мен дауысын да жақтырмаймыз. Сондықтан мықты компаниялар өз брендтеріне жағымды аффектіні (эмоцияны) байлау үшін көп жұмыс істейді. Профессорлар оқыту бойынша жоғары ұпай алған жылы студенттердің курстық материалдарға да жоғары баға беретінін жиі байқайды. Студенттер профессорды ұнатпаған жылы, олар дәл сол оқу материалдарына төмен баға береді. Дәл осы механизм эмоцияға қатысы жоқ жағдайда да жұмыс істейді: сіздің нанымыңыздың шынайы себептеріне қарамастан, сіз оны қолдайтын кез келген уәжді, тіпті қисынсыз болса да, қабылдауға бейім боласыз.
Қорытындыға негізделген ауытқудың нәзік мысалы — anchoring effect (зәкірлеу әсері — алғашқы естіген немесе көрген санның кейінгі сандық бағалауға негізсіз әсер етуі), бұл сандық бағалау жасауы тиіс адамдарға кездейсоқ санның тигізетін әсері. Типтік демонстрацияда сізге бағасын табу оңай емес заттар, мысалы, бейтаныс шарап бөтелкесі ұсынылуы мүмкін. Сізден әлеуметтік сақтандыру нөміріңіздің (SSN) соңғы екі цифрын жазып, бөтелке үшін сол соманы төлейтін-төлемейтініңізді көрсету сұралады. Соңында, ол үшін төлеуге дайын ең жоғары соманы айтуыңыз керек. Нәтижелер көрсеткендей, әлеуметтік сақтандыру нөміріңіздің соңғы цифрлары сіздің соңғы сатып алу бағаңызға әсер етеді. Бір зерттеуде, әлеуметтік сақтандыру нөмірлері жоғары «зәкір» (сексен доллардан астам) тудырған адамдар, төмен «зәкірі» (жиырма доллардан аз) бар адамдарға қарағанда шамамен үш есе көп төлеуге дайын екенін айтқан.
Әрине, әлеуметтік сақтандыру нөміріңіз шараптың бағасы туралы бағалауыңызға әсер етпеуі керек, бірақ ол әсер етеді. Зәкірлеу — өте күшті әсер және ол келіссөздерде жиі әдейі қолданылады. Сіз базарда саудалассаңыз да немесе күрделі бизнес-мәмілеге отырсаңыз да, бірінші болып ұсыныс жасау сізге артықшылық беруі мүмкін, себебі «зәкірді» қабылдаушы адам еріксіз сіздің ұсынысыңыздың неліктен орынды болуы мүмкін екенін ойлай бастайды. Адамдар әрқашан естіген нәрсесін мағыналы етуге тырысады; қисынсыз санды кездестіргенде, олар автоматты түрде сол санның қисынсыздығын азайтатын ойларды еске түсіреді.
Шамадан тыс бірізділік
Мұнда ауытқудың үшінші түрін сезінуге көмектесетін тағы бір эксперимент берілген. Сіз басқарушы лауазымға үміткердің сипаттамасын оқисыз. Сипаттама төрт сын есімнен тұрады, олардың әрқайсысы карточкаға жазылған. Карточкалар пачкасы жаңа ғана араластырылды. Алғашқы екі карточкада мынадай сипаттамалар бар:
Ақылды, Табанды.
Ақпарат толық болғанша бағалауды тоқтата тұру қисынды болар еді, бірақ олай болған жоқ: сізде үміткер туралы бағалау қалыптасып қойды және ол жағымды. Бұл бағалау өздігінен пайда болды. Сіз бұл процесті басқара алмадыңыз, ал бағалауды кейінге қалдыру мүмкін болмады.
Енді соңғы екі карточканы аласыз. Міне, толық сипаттама:
Ақылды, Табанды, Айлакер, Принципсіз.
Сіздің бағалауыңыз бұрынғыдай жақсы емес, бірақ ол жеткілікті деңгейде өзгерген жоқ. Салыстыру үшін, пачканы басқаша араластырғанда шығуы мүмкін келесі сипаттаманы қарастырыңыз:
Принципсіз, Айлакер, Табанды, Ақылды.
Бұл екінші сипаттама дәл сол сын есімдерден тұрады, бірақ олардың берілу ретіне байланысты ол біріншісіне қарағанда анық азырақ тартымды. «Айлакер» сөзі «Ақылды» және «Табанды» сөздерінен кейін келгенде тек шамалы ғана жағымсыз болды, өйткені біз әлі де (еш себепсіз) басқарушының ниеті жақсы деп сендік. Алайда «Принципсіз» дегеннен кейін келгенде «Айлакер» сөзі қорқынышты естіледі. Бұл контексте табандылық пен ақылдылық енді жағымды қасиет емес: олар жаман адамды одан сайын қауіпті ете түседі.
Бұл эксперимент excessive coherence (шамадан тыс бірізділік — мәлімет аз болса да біртұтас бейне қалыптастыруға бейімділік) құбылысын көрсетеді: біз бірізді әсерлерді тез қалыптастырамыз және оларды баяу өзгертеміз. Бұл мысалда біз аз ғана мәліметке сүйеніп, үміткерге бірден жағымды көзқарас таныттық. Растауға бейімділік — алдын ала үкіміміз болғанда қарама-қайшы дәлелдерді мүлдем елемеуге мәжбүрлейтін сол үрдіс — бізді кейінгі мәліметтерге тиісті деңгейде мән бермеуге итермеледі. (Бұл құбылысты сипаттайтын тағы бір термин — halo effect (нұрлану немесе ореол әсері — адамның бір жақсы қасиетіне бола оның барлық қасиетін жақсы деп қабылдау), себебі үміткер алғашқы әсердің жағымды «нұрымен» бағаланды. Біз 24-тарауда ореол әсерінің жұмысқа қабылдау шешімдеріндегі күрделі мәселе екенін көреміз).
Міне, тағы бір мысал. Америка Құрама Штаттарында мемлекеттік қызметкерлер тұтынушылардың, мысалы, чизбургерлердегі, гамбургерлердегі және салаттардағы калория мөлшерін көруін қамтамасыз ету үшін мейрамханалар желісіне калория жапсырмаларын ілуді міндеттеді. Бұл белгілерді көргеннен кейін тұтынушылар өз таңдауын өзгерте ме? Бұл мәселе бойынша дәлелдер әртүрлі және бір мәнді емес. Бірақ бір таңғаларлық зерттеуде тұтынушыларға калория жапсырмалары тағамның оң жағына қарағанда сол жағына орналастырылса, көбірек әсер ететіні анықталды. Калориялар сол жақта болғанда, тұтынушылар бұл ақпаратты бірінші қабылдайды және тағамды көрмей тұрып «өте көп калория! » немесе «калориясы аз екен! » деп ойлайтыны анық. Олардың алғашқы оң немесе теріс реакциясы таңдауларына қатты әсер етеді. Керісінше, адамдар алдымен тағамды көргенде, калория жапсырмасын көрмес бұрын «дәмді көрінеді! » немесе «онша емес сияқты» деп ойлайды. Мұнда да олардың алғашқы реакциясы таңдауларына үлкен ықпал етеді. Бұл болжамды авторлардың оңнан солға қарай оқитын иврит тілінде сөйлейтіндер үшін жүргізген зерттеуі де растайды: олар үшін калория жапсырмасы сол жаққа қарағанда оң жақта болғанда айтарлықтай үлкен әсерге ие болған.
Жалпы алғанда, біз асығыс қорытынды жасауға және содан айнымауға бейімбіз. Біз өз пікірімізді дәлелдерге негіздейміз деп ойлаймыз, бірақ біз қарастыратын дәлелдер мен оларды түсіндіруіміз, кем дегенде, белгілі бір дәрежеде біздің алғашқы шұғыл шешімімізге сәйкес келуі үшін бұрмалануы мүмкін. Нәтижесінде біз санамызда қалыптасқан жалпы оқиғаның бірізділігін сақтаймыз. Егер қорытындылар дұрыс болса, бұл процесс, әрине, қалыпты жағдай. Алайда, алғашқы бағалау қате болса, қарама-қайшы дәлелдерге қарамастан оны ұстану үрдісі қателерді күшейте түседі. Және бұл әсерді бақылау қиын, өйткені естіген немесе көрген ақпаратты елемеу мүмкін емес және оны ұмыту жиі қиынға соғады. Сотта судьялар кейде алқабилерге өздері естіген рұқсат етілмейтін дәлелдерді ескермеуді бұйырады, бірақ бұл шынайы нұсқау емес (дегенмен бұл алқабилердің талқылауында пайдалы болуы мүмкін, өйткені бұл дәлелге негізделген уәждерді ашық түрде қабылдамауға болады).
Психологиялық бейімділіктер «шу» тудырады
Біз әртүрлі тәсілдермен жұмыс істейтін бейімділіктердің үш түрін қысқаша ұсындық: орын басу бейімділігі (дәлелдерге дұрыс салмақ бермеуге әкеледі); қорытынды жасау бейімділігі (дәлелдерді аттап өтуге немесе оларды бұрмаланған түрде қарастыруға мәжбүр етеді); және шамадан тыс үйлесімділік (алғашқы әсердің күшін арттырып, қарама-қайшы ақпараттың ықпалын азайтады). Бейімділіктердің осы үш түрі де, әрине, статистикалық ауытқуды (bias) тудыруы мүмкін. Олар сондай-ақ «шу» (noise) тудыруы ықтимал.
Орын басудан бастайық. Көптеген адамдар Биллдің бухгалтер болу ықтималдығын оның сипаттамасының стереотипке ұқсастығына қарай бағалайды: бұл эксперименттегі нәтиже — ортақ бейімділік. Егер әрбір респондент бірдей қателік жіберсе, онда «шу» болмайды. Бірақ орын басу әрқашан мұндай бірауыыздылықты тудырмайды. «Климат өзгеруі бар ма? » деген сұрақ «Оның шын екенін айтатын адамдарға сенемін бе? » деген сұрақпен ауыстырылғанда, жауаптың адамның әлеуметтік ортасына, таңдаулы ақпарат көздеріне, саяси көзқарасына және т. б. байланысты бір адамнан екіншісіне қарай өзгеретінін көру оңай. Бірдей психологиялық бейімділік әртүрлі пайымдаулар мен адамдар арасындағы «шуды» тудырады.
Орын басу сонымен қатар жағдайлық шудың (бір адамның пайымдауының уақыт пен көңіл-күйге байланысты ауытқуы) көзі болуы мүмкін. Егер өмірге қанағаттану туралы сұраққа адам өзінің сол сәттегі көңіл-күйіне сүйеніп жауап берсе, жауап бір адам үшін әртүрлі уақытта міндетті түрде өзгереді. Қуанышты таңнан кейін көңілсіз түс қайтуы мүмкін, ал уақыт өте келе өзгерген көңіл-күй сұхбат алушының қай кезде хабарласқанына байланысты өмірге қанағаттану туралы мүлдем басқа есептерге әкелуі мүмкін. 7-тарауда біз психологиялық бейімділіктерден туындайтын жағдайлық шудың мысалдарын қарастырған болатынбыз.
Алдын ала қалыптасқан пайымдаулар да ауытқуды (bias) және «шуды» тудырады. Кіріспеде айтқан мысалымызға оралайық: судьялардың баспана іздеушілерді қабылдау пайызындағы таңғаларлық алшақтықтар. Бір судья өтініш берушілердің 5%-ын, ал дәл сол сот ғимаратындағы екіншісі 88%-ын қабылдағанда, біз олардың әртүрлі бағытта бейімделгеніне сенімді бола аламыз. Кеңірек тұрғыдан алғанда, бейімділіктердегі жеке айырмашылықтар ауқымды жүйелік шуды (шешімдердегі ретсіз алшақтық) тудыруы мүмкін. Әрине, егер судьялардың көпшілігі немесе барлығы ұқсас бейімділікке ие болса, жүйенің өзі де ауытқуға ұшырауы мүмкін.
Ақырында, шамадан тыс үйлесімділік ақпарат кезегі мен оған берілген мағына барлық (немесе көптеген) судьялар үшін бірдей болу-болмауына байланысты ауытқуды немесе «шуды» тудыруы мүмкін. Мысалы, сырт келбеті тартымды үміткерді қарастырайық, оның жақсы түрі рекрутерлердің көбінде алғашқы оң әсер қалдырады. Егер сыртқы келбет үміткер қарастырылып жатқан лауазымға қатыссыз болса, бұл оң ореол әсері ортақ қателікке — ауытқуға әкеледі.
Екінші жағынан, көптеген күрделі шешімдер кездейсоқ ретпен келетін ақпаратты жинақтауды талап етеді. 2-тараудағы сақтандыру мамандарын еске түсіріңіз. Сақтандыру жағдайы туралы деректердің келу реті бір маманнан екіншісіне және бір істен екіншісіне қарай кездейсоқ өзгереді, бұл алғашқы әсерлердегі кездейсоқ ауытқуларды тудырады. Шамадан тыс үйлесімділік бұл кездейсоқ ауытқулардың соңғы пайымдауларда кездейсоқ бұрмалаулар тудыратынын білдіреді. Нәтиже жүйелік «шу» болады.

Қысқасы, психологиялық бейімділіктер механизм ретінде әмбебап болып табылады және олар жиі ортақ қателіктерді тудырады. Бірақ бейімділіктерде үлкен жеке айырмашылықтар болғанда (әртүрлі алдын ала пайымдаулар) немесе бейімділіктердің әсері контекстке байланысты болғанда (әртүрлі қоздырғыштар), «шу» пайда болады. Ауытқу да, «шу» да қателік тудырады, бұл психологиялық бейімділіктерді азайтатын кез келген нәрсе пайымдауды жақсартатынын білдіреді. Біз бейімділіктерді жою тақырыбына 5-бөлімде ораламыз. Ал әзірге пайымдау процесін зерттеуді жалғастырамыз.
Эвристика, бейімділік және «шу» туралы айтар болсақ
«Біз өзімізде психологиялық бейімділіктер бар екенін білеміз, бірақ кез келген қатені нақтыланбаған "бейімділіктерге" жаба салу ниетіне қарсы тұруымыз керек».
«Біз жауап беруіміз керек сұрақтың орнына оңайырақ сұрақты қойғанда, қателіктердің болуы сөзсіз. Мысалы, біз ықтималдықты ұқсастық бойынша бағалағанда базалық мөлшерлемені елемейміз».
«Алдын ала қалыптасқан пайымдаулар және басқа да қорытынды жасау бейімділіктері адамдарды дәлелдерді өздерінің алғашқы ұстанымдарының пайдасына бұрмалауға итермелейді».
«Біз әсерлерді тез қалыптастырамыз және қарама-қайшы ақпарат түскенде де оларды ұстана береміз. Бұл үрдіс "шамадан тыс үйлесімділік" деп аталады».
«Егер көптеген адамдар бірдей бейімділіктерге ие болса, психологиялық бейімділіктер статистикалық ауытқуды тудырады. Алайда, көптеген жағдайларда адамдардың бейімділіктері әртүрлі болады. Мұндай жағдайларда психологиялық бейімділіктер жүйелік "шуды" тудырады».
OceanofPDF. com
14-ТАРАУ. Сәйкестендіру операциясы
Аспанға қараңыз. Екі сағаттан кейін жаңбыр жауу ықтималдығы қандай? Сізде бұл сұраққа жауап беруде қиындық туындамаған болар. Сіз жасаған пайымдау — мысалы, жақын арада жаңбыр жаууы «өте ықтимал» деген шешім — еш күш жұмсамай-ақ пайда болды. Қалай болғанда да, аспанның қараңғылығын бағалауыңыз ықтималдық туралы пайымдауға айналды.
Сіз жаңа ғана орындаған әрекет — сәйкестендірудің қарапайым мысалы. Біз пайымдауды субъективті әсерге (немесе әсердің бір аспектісіне) шкала бойынша мән беретін операция ретінде сипаттадық. Сәйкестендіру — сол операцияның маңызды бөлігі. Сіз «1-ден 10-ға дейінгі шкала бойынша көңіл-күйіңіз қаншалықты жақсы? » немесе «Бүгін таңертеңгі сауда жасау тәжірибеңізге бірден беске дейін жұлдыз беріңізші» деген сұрақтарға жауап бергенде, сіз сәйкестендіру жасап жатырсыз: сіздің міндетіңіз — пайымдау шкаласынан көңіл-күйіңізге немесе тәжірибеңізге сәйкес келетін мәнді табу.
Сәйкестендіру және үйлесімділік
Сіз алдыңғы тарауда Биллмен танысқансыз, ол міне тағы да алдыңызда: «Билл отыз үш жаста. Ол ақылды, бірақ қиялы жоқ, ұқыпты және жалпы алғанда өмірге құлшынысы төмен. Мектепте математикадан мықты болды, бірақ әлеуметтік ғылымдар мен гуманитарлық пәндерден әлсіз еді». Біз сізден Биллдің әртүрлі мамандықтар мен хоббилерге ие болу ықтималдығын бағалауды сұрадық және сіз бұл сұраққа ықтималдық туралы пайымдауды ұқсастық туралы пайымдаумен алмастыру арқылы жауап бергеніңізді көрдік. Сіз Биллдің бухгалтер болу ықтималдығын емес, оның осы мамандықтың стереотипіне қаншалықты ұқсас екенін сұрадыңыз. Енді біз жауапсыз қалдырған сұраққа көшеміз: сіз бұл пайымдауды қалай жасадыңыз?
Биллдің сипаттамасы мамандықтар мен хоббилердің стереотиптеріне қаншалықты сәйкес келетінін бағалау қиын емес. Билл бухгалтерге қарағанда типтік джаз орындаушысына айтарлықтай аз ұқсайды, ал серфингшіге тіпті ұқсамайды. Бұл мысал сәйкестендірудің ерекше жан-жақтылығын көрсетеді, бұл әсіресе адамдар туралы пайымдауларда анық байқалады. Билл туралы сіз жауап бере алатын сұрақтарда шек жоқ. Мысалы, онымен бірге айдаладағы аралда қалып қою туралы не ойлайсыз? Берілген аз ғана ақпарат негізінде сізде бұл сұраққа бірден интуитивті жауап пайда болған шығар. Дегенмен, бізде сіз үшін жаңалық бар: біз білетін Билл — ерекше өмір сүру дағдылары бар, шыныққан зерттеуші болып шықты. Егер бұл сізді таңғалдырса (және солай болуы мүмкін), сіз жаңа ғана үйлесімділікке қол жеткізе алмау жағдайын бастан өткердіңіз.
Таңғалыс күшті болады, өйткені жаңа ақпарат сіз бұрын құрастырған Биллдің бейнесіне сәйкес келмейді. Енді Биллдің ерлігі мен өмір сүру дағдылары бастапқы сипаттамаға енгізілгенін елестетіп көріңіз. Сізде бұл адам туралы басқаша жалпы бейне қалыптасар еді, мүмкін тек табиғат аясында ғана жаны кіретін адам ретінде. Билл туралы жалпы әсер азырақ үйлесімді болар еді, сондықтан мамандықтар немесе хобби санаттарына сәйкестендіру қиынырақ болар еді, бірақ сіз қазіргідей диссонансты сезінбес едіңіз.
Қарама-қайшы белгілер үйлесімділік сезіміне қол жеткізуді және қанағаттанарлық сәйкестік табатын пайымдауды жасауды қиындатады. Қарама-қайшы белгілердің болуы күрделі пайымдауларға тән, мұнда біз көптеген «шуды» кездестіреміз деп күтеміз. Кейбір көрсеткіштері оң, ал басқалары теріс болған Гамбарди мәселесі осындай пайымдау болды. Біз күрделі пайымдауларға 16-тарауда ораламыз. Осы тараудың қалған бөлігінде біз салыстырмалы түрде қарапайым пайымдауларға — әсіресе қарқындылық шкалаларында жасалатындарға назар аударамыз.
Қарқындылықты сәйкестендіру
Біз пайымдауларды білдіретін кейбір шкалалар сапалы болып табылады: мамандықтар, хоббилер және медициналық диагноздар — бұған мысал. Олар шкала мәндерінің реттелмегендігімен анықталады: қызыл түс көктен артық та, кем де емес.
Алайда көптеген пайымдаулар сандық қарқындылық шкалаларында жасалады. Көлемді, салмақты, жарықтықты, температураны немесе дауыс қаттылығын физикалық өлшеу; құн немесе құндылық өлшемдері; ықтималдық немесе жиілік пайымдаулары — мұның бәрі сандық. Сенімділік, күш, тартымдылық, ашу, қорқыныш, азғындық немесе жазаның қатаңдығы сияқты дерексіз шкалалардағы пайымдаулар да солай.
Бұл сандық өлшемдерге ортақ ерекшелік — «Қайсысы көбірек? » деген сұраққа бір өлшемдегі кез келген жұп мән үшін жауап беруге болады. Сіз дүре соғудың жеңіл шапалақтан гөрі қатаң жаза екенін немесе сізге «Гамлеттің» «Годоны күтуге» қарағанда көбірек ұнайтынын айта аласыз, дәл күннің айдан жарық екенін, пілдің атжалманнан ауыр екенін және Майамидегі орташа температураның Торонтодан жоғары екенін айта алатыныңыз сияқты.
Адамдарда бір қарқындылық шкаласын екіншісіне түсіру арқылы байланысы жоқ өлшемдер бойынша қарқындылықты сәйкестендірудің таңғажайып интуитивті қабілеті бар. Сіз әртүрлі әншілерге деген сүйіспеншілігіңіздің қарқындылығын қалаңыздағы ғимараттардың биіктігімен сәйкестендіре аласыз. (Мысалы, егер сіз Боб Диланды ерекше керемет деп санасаңыз, оған деген ықыласыңыздың деңгейін қалаңыздағы ең биік ғимаратпен сәйкестендіруіңіз мүмкін. ) Сіз өз еліңіздегі саяси алауыздықтың қазіргі деңгейін өзіңіз жақсы білетін қаланың жазғы температурасымен сәйкестендіре аласыз. (Егер керемет саяси үйлесімділік болса, оны Нью-Йорктегі самал ескен 70 градустық жазғы күнмен сәйкестендіруіңіз мүмкін. ) Егер сізден мейрамханаға берген бағаңызды үйреншікті 1-ден 5-ке дейінгі жұлдыз шкаласының орнына романның ұзындығымен салыстырып білдіруді сұраса, бұл өтініш сізге өте оғаш көрінуі мүмкін, бірақ орындалмайтын нәрсе емес. (Сіздің сүйікті мейрамханаңыз «Соғыс және бейбітшілік» сияқты болуы мүмкін. ) Әр жағдайда — бұл оғаш болса да — не айтқыңыз келгені өте түсінікті.
Кәдімгі әңгімеде шкала мәндерінің диапазоны контекстке байланысты болады. «Ол көп ақша жинап жүр» деген пікір табысты инвестициялық банкирдің зейнетке шығуына арналған тілекте айтылғандағы мағынасы, бала бағумен айналысатын жасөспірімді құттықтағандағы мағынасынан мүлдем басқа. Және үлкен және кіші сияқты сөздердің мағынасы толығымен эталондық негізге байланысты. Мысалы, біз «Үлкен тышқан кішкентай пілдің тұмсығымен жоғары қарай жүгіріп кетті» деген сияқты мәлімдені түсіне аламыз.
Сәйкестендіру болжамдарының ауытқуы
Келесі жұмбақ сәйкестендірудің күшін де, онымен байланысты жүйелі пайымдау қателігін де көрсетеді. Джули — университеттің бітіруші курс студенті. Ол туралы келесі ақпаратты оқып, оның GPA (орташа үлгерім балы) қандай екенін болжап көріңіз (0. 0-ден 4. 0-ге дейінгі стандартты шкала бойынша): GPA (Grade Point Average – АҚШ-тағы білім деңгейін көрсететін 0-ден 4-ке дейінгі бағалау жүйесі). Джули төрт жасында еркін оқи алатын еді. Оның GPA балы қандай?
Егер сіз Америка Құрама Штаттарындағы орташа балл жүйесімен таныс болсаңыз, сіздің ойыңызға бірден сан келді және ол 3. 7 немесе 3. 8-ге жақын болған шығар. Джулидің GPA туралы болжамның сіздің ойыңызға қалай бірден келгені біз жаңа ғана сипаттаған сәйкестендіру процесін көрсетеді.
Біріншіден, сіз Джулидің қаншалықты ерте оқи бастағанын бағаладыңыз. Бағалау оңай болды, өйткені Джули әдеттен тыс ерте оқыды және бұл ерте дамығандық Джулиді белгілі бір шкала бойынша санатқа орналастырды. Егер сіз қолданған шкаланы сипаттауыңыз керек болса, оның ең жоғары санаты «ерекше ерте дамыған» сияқты бірдеңе екенін айтар едіңіз және Джулидің бұл санатқа толық жатпайтынын атап өтер едіңіз (кейбір балалар екі жасқа дейін оқиды). Джули, сірә, келесі санатқа — «әдеттен тыс, бірақ ерекше емес ерте дамыған» балалар тобына жатады.
Екінші қадамда сіз GPA пайымдауын Джули туралы бағалауыңызбен сәйкестендірдіңіз. Мұны өзіңіз байқамасаңыз да, сіз «әдеттен тыс, бірақ ерекше емес» деген белгіге сәйкес келетін GPA мәнін іздеген болуыңыз керек. Джулидің оқиғасын естігенде, сіздің ойыңызға кенеттен сәйкестендіру болжамы келді.
Осы бағалау және сәйкестендіру тапсырмаларын орындау үшін қажетті есептеулерді саналы түрде жүргізу біраз уақытты алар еді, бірақ тез, 1-жүйе (адамның интуитивті және жылдам ойлау механизмі) ойлауында пайымдау тез және еш қиындықсыз орындалады. Біз мұнда Джулидің GPA-ін болжау туралы айтып отырған оқиғамыз тікелей байқауға болмайтын психикалық оқиғалардың күрделі, көп сатылы тізбегін қамтиды. Сәйкестендірудің психикалық механизмінің ерекшелігі психологияда сирек кездеседі, бірақ оның дәлелдері өте сенімді. Біз көптеген ұқсас эксперименттерден келесі екі сұрақтың әртүрлі адамдар тобына қойылғанда, дәл бірдей сандарды шығаратынына сенімді бола аламыз:

Джулидің сыныбындағылардың қанша пайызы одан ерте жаста оқыды?

Джулидің сыныбындағылардың қанша пайызының GPA балы одан жоғары?
Бірінші сұрақты өздігінен шешуге болады: ол жай ғана Джули туралы берілген дәлелдерді бағалауды сұрайды. Алдын ала болжауды талап ететін екінші сұрақ, әрине, қиынырақ — бірақ оған бірінші сұраққа жауап беру арқылы жауап беру интуитивті түрде қызықтырады.
Джули туралы қойған екі сұрағымыз сенімділік елесін ертерек талқылағанда әмбебап шатастыратын деп сипатталған екі сұраққа ұқсас. Джули туралы бірінші сұрақ сізден оның жағдайы туралы ақпараттың «қарқындылығын» бағалауды талап етеді. Екінші сұрақ болжамның қарқындылығы туралы сұрайды. Және біз оларды әлі де бір-бірінен ажырату қиын деп күдіктенеміз.
Джулидің GPA-ін интуитивті болжау — бұл 13-тарауда біз сипаттаған психологиялық механизмнің мысалы: қиын сұрақты оңай сұрақпен алмастыру. Сіздің 1-жүйеңіз әлдеқайда оңай сұраққа жауап беру арқылы қиын болжау сұрағын жеңілдетеді: Джулидің төрт жасар оқырман ретіндегі жетістігі қаншалықты әсерлі болды? Жылдармен өлшенетін оқу жасынан ұпайлармен өлшенетін GPA-ге тікелей өту үшін қосымша сәйкестендіру қадамы қажет.
Алмастыру, әрине, қолжетімді ақпарат маңызды болған жағдайда ғана болады. Егер Джули туралы білетініңіз тек оның жылдам жүгіретіні немесе орташа биші екені болса, сізде ешқандай ақпарат болмас еді. Бірақ зияткерліктің сенімді көрсеткіші ретінде түсіндірілуі мүмкін кез келген факт қолайлы алмастырғыш болуы мүмкін.
Бір сұрақты екіншісімен алмастыру екі сұрақтың шынайы жауаптары әртүрлі болған кезде міндетті түрде қателіктер тудырады. Оқу жасын GPA-мен алмастыру, қаншалықты қисынды болып көрінгенімен, анық ақылға қонымсыз. Неліктен екенін түсіну үшін Джули төрт жаста болғаннан бері орын алуы мүмкін оқиғалар туралы ойланыңыз. Ол қорқынышты апатқа ұшырауы мүмкін еді. Оның ата-анасы ауыр ажырасуды бастан кешіруі мүмкін еді. Ол оған қатты әсер еткен шабыттандыратын мұғалімді кездестіруі мүмкін еді. Ол жүкті болып қалуы мүмкін еді. Осы оқиғалардың кез келгені және тағы басқалары оның колледждегі оқуына әсер етуі мүмкін еді.
Сәйкестендіру болжамы оқудың ерте дамуы мен колледждегі GPA балы арасында тамаша корреляция болған жағдайда ғана ақталуы мүмкін, бұл анық олай емес. Екінші жағынан, Джулидің оқу жасы туралы ақпаратты мүлдем елемеу де қате болар еді, өйткені оның оқу жасы кейбір маңызды ақпаратты береді. Оңтайлы болжам мінсіз білім мен нөлдік білімнің осы екі шетінің арасында болуы керек.
Сіз қандай да бір жағдай туралы ештеңе білмесеңіз — тек оның қай санатқа жататынын білсеңіз, не білесіз? Бұл сұрақтың жауабы — біз жағдайға сырттан қарау деп атаған нәрсе. Егер бізден Джулидің GPA балын болжау сұралса, бірақ ол туралы ешқандай ақпарат берілмесе, біз міндетті түрде орташа мәнді — бәлкім, 3. 2-ні болжар едік. Бұл сыртқы көзқарас бойынша болжам. Сондықтан Джулидің GPA балының ең жақсы бағасы 3. 2-ден жоғары және 3. 8-ден төмен болуы керек. Бағалаудың нақты орны ақпараттың болжамдық мәніне байланысты: GPA болжаушысы ретінде оқу жасына неғұрлым көп сенсеңіз, бағалау соғұрлым жоғары болады. Джулидің жағдайында ақпарат, әрине, әлсіз, сондықтан ең қисынды болжам орташа GPA-ге жақынырақ болады. Сәйкестендіру болжамдарының қатесін түзетудің техникалық, бірақ өте оңай жолы бар; біз оны С қосымшасында егжей-тегжейлі сипаттаймыз.
Статистикалық тұрғыдан алғанда ақылға қонымсыз болса да, дәлелдерге сәйкес келетін болжамдарға қарсы тұру қиын. Сату менеджерлері көбінесе өткен жылы сату тобының қалған бөлігіне қарағанда табысты болған сатушы алдағы уақытта да жоғары нәтиже көрсетуін жалғастырады деп есептейді. Жоғары лауазымды басшылар кейде ерекше дарынды үмкерді кездестіреді және жаңа қызметкердің ұйымның шыңына қалай көтерілетінін елестетеді. Продюсерлер алдыңғы фильмі хит болған режиссердің келесі фильмі де дәл сондай табысты болады деп әдетте күтеді.
Сәйкестендіру болжамдарының бұл мысалдары көңіл қалумен аяқталуы ықтимал. Екінші жағынан, жағдай нашар болған кезде жасалған сәйкестендіру болжамдары тым теріс болуы мүмкін. Дәлелдерге сәйкес келетін интуитивті болжамдар оптимистік болса да, пессимистік болса да тым шектен шыққан болып келеді. (Мұндай болжам қателіктерінің техникалық термині — олар бейрегрессивті болып табылады, өйткені олар орташа мәнге қайту деп аталатын статистикалық құбылысты ескермейді). Орташа мәнге қайту (статистикалық заңдылық, төтенше нәтижелердің уақыт өте орташа деңгейге жақындауы).
Айта кету керек, алмастыру (күрделі сұрақты қарапайымға ауыстыру) мен сәйкестендіру (әр түрлі шкалалардағы қарқындылықты теңестіру) әрқашан болжамдарды басқара бермейді. Екі жүйе тілімен айтсақ, интуитивті [1-ші жүйе] (тез, автоматты әрі сезімге негізделген ойлау моделі) мәселе туындаған кезде жылдам ассоциативті шешімдер ұсынады, бірақ бұл интуициялар сенімге айналмас бұрын, анағұрлым рефлексивті [2-ші жүйе] (баяу, аналитикалық әрі күш жұмсауды талап ететін ойлау моделі) тарапынан мақұлдануы тиіс. Сәйкестендіруге негізделген болжамдар кейде күрделірек жауаптардың пайдасына қарай қабылданбай тасталады. Мысалы, адамдар жағымсыз дәлелдерді жағымды дәлелдерге қарағанда сәйкестендіруге құлықсызырақ болады. Егер Джули кеш оқи бастаған болса, сіз оның колледждегі үлгерімі төмен болады деп сәйкестендіру болжамын жасауға іркілер едіңіз деп ойлаймыз. Ақпарат көбейген сайын жағымды және жағымсыз болжамдар арасындағы бұл асимметрия жойылады.
Біз кез келген интуитивті болжамдарды түзету үшін <span data-term="true">сыртқы көзқарасты</span> (мәселені жеке оқиға емес, ұқсас жағдайлар жиынтығы мен статистикасы тұрғысынан қарау әдісі) ұсынамыз.
Мысалы, Майкл Гамбардидің болашақ перспективаларын талқылағанда, біз оның табысқа жету ықтималдығы туралы пайымдауды тиісті негізгі көрсеткішке (жаңадан келген бас директорлардың екі жылдық табыс көрсеткішіне) негіздеуді ұсындық. Джулидің орташа балы (GPA) сияқты сандық болжамдар жағдайында сыртқы көзқарасты қолдану — болжамыңызды орташа нәтижеге байлауды білдіреді. Сыртқы көзқарасты тек қолда бар ақпарат толық сеніммен болжам жасауға мүмкіндік беретін өте оңай есептерде ғана есепке алмауға болады. Күрделі пайымдау қажет болғанда, сыртқы көзқарас шешімнің ажырамас бөлігі болуы тиіс.
Сәйкестендірудегі шу: Абсолютті пайымдаудың шектеулері
Санаттарды қарқындылық шкалалары бойынша ажырата алу қабілетіміздің шектеулілігі сәйкестендіру операциясының дәлдігін тежейді. «Үлкен» немесе «бай» сияқты сөздер мөлшер немесе байлық өлшеміндегі мәндердің тұтас бір диапазонына бірдей белгі тағады. Бұл шудың (бірдей жағдайдағы шешімдердің кездейсоқ алшақтығы) маңызды көзі болуы мүмкін.
Зейнетке шыққан инвестициялық банкир, әрине, «бай» деген анықтамаға лайық, бірақ ол қаншалықты бай? Бізде таңдауға болатын көптеген сын есімдер бар: ауқатты, дәулетті, жағдайы жақсы, бай-қуатты, аса бай және т. б. Егер сізге кейбір адамдардың байлығы туралы егжей-тегжейлі сипаттамалар берілсе және әрқайсысына бір сын есім таңдау керек болса — жағдайларды бір-бірімен тікелей салыстырмай-ақ — қанша айқын санатты қалыптастыра алар едіңіз?
Қарқындылық шкаласында біз ажырата алатын санаттардың саны 1956 жылы жарияланған психологиядағы барлық уақыттың классикалық мақаласының тақырыбында берілген: «Сиқырлы жеті саны, плюс немесе минус екі». Осы шектен асқанда, адамдар қателік жібере бастайды — мысалы, егер оларды тікелей бетпе-бет салыстырса, B-ны A-дан жоғары бағалай тұра, жеке-жеке бағалағанда A-ны B-дан жоғары санатқа жатқызуы мүмкін.
Ұзындығы 2-ден 4 дюймге дейінгі төрт түрлі сызықты елестетіңіз, әр сызық келесісінен бірдей мөлшерде ұзынырақ. Сізге бір-бірден сызық көрсетіледі және сіз 1-ден 4-ке дейінгі санды айтуыңыз керек, мұнда 1 — ең қысқа сызық, ал 4 — ең ұзыны. Бұл тапсырма оңай. Енді сізге ұзындығы бес түрлі сызық көрсетілді және сіз 1-ден 5-ке дейінгі сандарды айтуыңыз керек делік. Әлі де оңай. Сіз қашан қателесе бастайсыз? Шамамен жеті сызық деген «сиқырлы санның» маңында. Таңқаларлығы, бұл сан сызықтар ұзындығының диапазонына өте аз байланысты: егер сызықтар 2 мен 4 дюйм емес, 2 мен 6 дюйм аралығында болса да, сіз бәрібір жеті сызықтан кейін қателесе бастайсыз. Дәл осындай нәтиже қаттылығы әр түрлі дыбыстарды немесе жарықтығы әр түрлі шамдарды бағалағанда да байқалады. Адамдардың белгілі бір өлшем бойынша стимулдарға айқын белгілер тағайындау қабілетінде нақты шектеу бар және бұл шек — жеті белгінің маңында.
Біздің ажырату қабілетіміздің бұл шегі маңызды, себебі қарқындылық өлшемдері бойынша мәндерді сәйкестендіру қабілетіміз осы өлшемдерге мәндер тағайындау қабілетімізден жоғары бола алмайды. Сәйкестендіру операциясы — тез, [1-ші жүйе] ойлауының әмбебап құралы және көптеген интуитивті пайымдаулардың өзегі, бірақ ол өте қарапайым.
Бұл сиқырлы сан абсолютті шектеу емес. Адамдарды иерархиялық санаттарға бөлу арқылы нәзік айырмашылықтарды тануға үйретуге болады. Мысалы, біз мультимиллионерлер арасында байлықтың бірнеше санатын ажырата аламыз, ал судьялар қылмыстың бірнеше санатындағы қатаңдық дәрежелерін ажырата алады. Алайда, бұл жетілдіру процесі жұмыс істеуі үшін санаттар алдын ала бар болуы және олардың шекаралары айқын болуы тиіс. Бір топ сызыққа белгілер тағайындағанда, сіз ұзын сызықтарды қысқалардан бөліп, оларды екі бөлек санат ретінде қарастыруды өз еркіңізбен шеше алмайсыз. Сіз «тез ойлау» режимінде болғанда, санаттарға бөлу ерікті бақылауға бағынбайды.
Сын есімдік шкалалардың шектеулі мүмкіндігін жеңудің жолы бар: белгілерді қолданудың орнына, салыстыруды қолданыңыз. Біздің жағдайларды салыстыру қабілетіміз оларды шкалаға қою қабілетімізден әлдеқайда жоғары.
Егер сізге мейрамханалардың немесе әншілердің үлкен тобын бағалау үшін жиырма балдық сапа шкаласын қолдану бұйырылса, не істеріңізді ойлаңыз. Бес жұлдызды шкаланы басқару оңай болар еді, бірақ жиырма балдық шкалада мінсіз тұрақтылықты сақтау мүмкін емес. (Joe’s Pizza үш жұлдызға лайық, бірақ ол он бір ме, әлде он екі ме? ) Бұл мәселенің шешімі қарапайым, бірақ уақытты қажет етеді. Сіз алдымен бес балдық рейтинг шкаласын қолданып, мейрамханаларды немесе әншілерді бес санатқа бөліп аласыз. Содан кейін әр санаттағы жағдайларды рет-ретімен қойып шығасыз (ранжирлейсіз), бұл әдетте қиындық тудырмайды: сіз тіпті оларды бір санатқа жатқызсаңыз да, Joe’s Pizza-ны Fred’s Burgers-тен немесе Тейлор Свифтті Боб Диланнан артық көретініңізді білесіз. Жұмысты жеңілдету үшін енді бес санаттың әрқайсысында төрт деңгейді ажырата аласыз. Сіз тіпті өзіңізге ең ұнамайтын әншілердің арасында да жек көру деңгейлерін ажырата аларсыз.
Бұл жаттығудың психологиясы қарапайым. Пайымдау объектілерін бір-бірлеп бағалағаннан көрі, оларды нақты салыстыру анағұрлым нәзік айырмашылықтарды анықтауға мүмкіндік береді. Сызық ұзындығы туралы пайымдаулар да осындай: бірінен соң бірі көрсетілген сызықтардың ұзындығын салыстыру қабілетіңіз ұзындықтарға белгі тағайындау қабілетіңізден әлдеқайда жоғары, ал бір уақытта көрініп тұрған сызықтарды салыстырғанда тіпті дәлірек боласыз.
Салыстырмалы пайымдаулардың артықшылығы көптеген салаларға тән. Егер сізде адамдардың байлығы туралы жалпы түсінік болса, олардың байлығына жеке-жеке белгі таққаннан көрі, бір диапазондағы адамдарды өзара салыстыру арқылы жақсырақ нәтижеге жетесіз. Егер сіз эсселерді бағаласаңыз, оларды бір-бірлеп оқып баға қойғаннан көрі, ең жақсысынан ең нашарына дейін реттегенде (ранжирлегенде) дәлірек боласыз. Салыстырмалы немесе релятивті пайымдаулар санаттық немесе абсолютті пайымдауларға қарағанда сезімталырақ. Бұл мысалдар көрсеткендей, олар сонымен қатар көбірек күш пен уақытты талап етеді.
Объектілерді нақты салыстырмалы шкалалар бойынша жеке-жеке бағалау салыстырмалы пайымдаудың кейбір артықшылықтарын сақтайды. Кейбір контексттерде, әсіресе білім беру саласында, кандидаттарды қабылдау немесе жоғарылату үшін ұсыныс жасағанда, көбінесе кандидатты белгілі бір топтың (мысалы, «сіз оқытқан студенттер» немесе «тәжірибе деңгейі бірдей бағдарламашылар») «үздік 5%» немесе «үздік 20%» қатарына орналастыру талап етіледі. Бұл рейтингтерге толық сену қиын, өйткені ұсыныс берушілердің шкаланы дұрыс қолдануын қадағалау мүмкін емес. Алайда, кейбір жағдайларда жауапкершілікті қамтамасыз етуге болады: менеджерлер қызметкерлерді бағалағанда немесе аналитиктер инвестицияларды бағалағанда, жағдайлардың 90%-ын «үздік 20%» санатына жатқызатын адамды анықтап, түзетуге болады. Салыстырмалы пайымдауларды қолдану — біз 5-бөлімде талқылайтын шуды азайтудың бір жолы.
Көптеген пайымдау тапсырмалары жеке жағдайларды шкаладағы санатқа сәйкестендіруді (мысалы, жеті балдық келісім шкаласы) немесе реттелген сын есімдер жиынтығын қолдануды (мысалы, оқиғалардың ықтималдығын бағалауда «екіталай» немесе «өте екіталай») талап етеді. Сәйкестендірудің бұл түрі шулы, себебі ол өте дөрекі. Адамдар пайымдаудың мәні бойынша келіссе де, белгілерді түсіндіруде әр түрлі болуы мүмкін. Нақты салыстырмалы пайымдауларды талап ететін процедура шуды азайтуы ықтимал. Келесі тарауда біз дұрыс емес шкалаларды қолдану шуды қалай арттыратынын әрі қарай зерттейміз.
Сәйкестендіру туралы сөз
— «Екеуміз де бұл фильмді өте жақсы дейміз, бірақ сен одан маған қарағанда әлдеқайда аз ләззат алған сияқтысың. Біз бірдей сөздерді қолданып тұрмыз, бірақ бірдей шкаланы қолданып тұрмыз ба? » — «Біз бұл сериалдың 2-ші маусымы 1-ші маусым сияқты керемет болады деп ойладық. Біз сәйкестендіру болжамын жасадық, бірақ ол қате болды». — «Бұл эсселерді бағалау кезінде бірізділікті сақтау қиын. Оның орнына оларды реттеп (ранжирлеп) көру керек пе? »
15-ТАРАУ. Шкалалар
Өзіңізді азаматтық соттағы алқаби ретінде елестетіңіз. Сіз төменде қысқаша баяндалған дәлелдемелерді тыңдадыңыз және ол бойынша кейбір шешімдер қабылдауыңыз керек.
Джоан Гловер General Assistance компаниясына қарсы
Алты жасар бала Джоан Гловер рецептсіз берілетін аллергияға қарсы «Allerfree» дәрісінің көптеген таблеткаларын ішіп қойып, ұзақ уақыт ауруханада жатуға мәжбүр болды. Артық мөлшер оның тыныс алу жүйесін әлсіреткендіктен, ол өмірінің соңына дейін астма және эмфизема сияқты тыныс алу жолдарының ауруларына бейім болады. «Allerfree» құтысында балалардан қорғайтын қауіпсіздік қақпағы нашар жасалған.
«Allerfree» өндірушісі — түрлі рецептсіз дәрі-дәрмектер шығаратын ірі компания (жылдық пайдасы 100-ден 200 миллион долларға дейін) General Assistance. Федералдық ереже барлық дәрі құтыларында балалардан қорғайтын қауіпсіздік қақпақтары болуын талап етеді. General Assistance компаниясы саладағы басқаларға қарағанда істен шығу деңгейі әлдеқайда жоғары қауіпсіздік қақпағын қолдану арқылы бұл ереженің мақсатын жүйелі түрде елемеген. Компанияның ішкі құжатында «бұл ақымақ, қажетсіз федералдық ереже — ақшамызды босқа шығындау» және жазалану қаупі төмен екені айтылған. Құжатта, кез келген жағдайда, «ережені бұзғаны үшін жазалар өте жеңіл; негізінен бізден болашақта қауіпсіздік қақпақтарын жақсарту сұралады» делінген. АҚШ-тың Азық-түлік және дәрі-дәрмек сапасын бақылау басқармасының (FDA) ресми өкілі ескерту жасағанына қарамастан, компания ешқандай түзету шараларын қолданбауға шешім қабылдаған.
Содан кейін біз сізден үш пайымдау жасауды сұраймыз. Жауаптарыңызды таңдау үшін асықпаңыз.
Ашу-ыза: Төмендегілердің қайсысы жауапкердің іс-әрекеті туралы сіздің пікіріңізді жақсырақ білдіреді? (Жауабыңызды дөңгелектеңіз). Мүлдем қабылдауға болады: 0 — 1 Қарсылық тудырады: 2 — 3 Шошытарлық: 4 — 5 Мүлдем шектен шыққан: 6
Жазалау ниеті: Өтемақы төлеуден бөлек, жауапкер қаншалықты жазалануы керек? (Тиісті жаза деңгейі туралы пікіріңізді жақсырақ білдіретін санды дөңгелектеңіз). Жазаланбауы керек: 0 — 1 Жеңіл жаза: 2 — 3 Қатаң жаза: 4 — 5 Өте қатаң жаза: 6
Шығындар: Өтемақы төлеуден бөлек, жауапкерді жазалау және оны немесе басқаларды болашақта мұндай әрекеттерден тежеу үшін жауапкерден қандай мөлшерде жазалаушы өтемақы (шығынды жабудан бөлек, айыптыны жазалау мақсатындағы айыппұл) төлеу талап етілуі керек? (Жауабыңызды төмендегі бос орынға жазыңыз). $ ___________

Джоан Гловердің оқиғасы — екеуміз (Канеман және Санстейн, досымыз әрі әріптесіміз Дэвид Шкадемен бірге) 1988 жылы жариялаған зерттеуде қолданылған істің сәл қысқартылған нұсқасы. Біз бұл зерттеуді осы тарауда егжей-тегжейлі сипаттаймыз және сіз осы зерттеуге енген тапсырмалардың бірін сезінгеніңізді қаладық, өйткені біз қазір оны осы кітаптың көптеген тақырыптарын қайталайтын шу аудитінің көрнекі мысалы ретінде көреміз.
Бұл тарау шудың кең таралған көзі ретіндегі жауап шкаласының рөліне арналған. Адамдар пайымдаудың мәні бойынша келіспегендіктен емес, шкаланы әр түрлі қолданғандықтан пайымдауларында алшақтық болуы мүмкін. Егер сіз қызметкердің жұмысын бағаласаңыз, 0-ден 6-ға дейінгі шкала бойынша жұмыс 4-ке тең дер едіңіз — бұл сіздің көзқарасыңыз бойынша өте жақсы. Басқа біреу дәл осы шкала бойынша қызметкердің жұмысы 3-ке тең деп айтуы мүмкін — бұл оның көзқарасы бойынша да өте жақсы. Шкалалардың тұжырымдамасындағы бұлдырлық — жалпы мәселе. «Ақылға қонымды күмәннен тыс», «айқын және сенімді дәлелдер», «үздік нәтиже» және «болуы екіталай» сияқты бұлыңғыр сөздерден туындайтын қарым-қатынас қиындықтары бойынша көптеген зерттеулер жүргізілді. Мұндай тіркестермен білдірілген пайымдаулар сөзсіз шулы болады, өйткені оларды сөйлеуші де, тыңдаушы да әр түрлі түсінеді.
Джоан Гловердің ісі жазылған зерттеуде біз бұлдыр шкаланың маңызды салдары бар жағдайдағы әсерін бақыладық. Зерттеу тақырыбы — алқабилер тағайындайтын жазалаушы өтемақылардағы шу болды. Джоан Гловердің ісі туралы үшінші сұрақтан аңғарғаныңыздай, Америка Құрама Штаттарындағы (және кейбір басқа елдердегі) заң азаматтық істер бойынша алқабилерге іс-әрекеті өте өрескел болған жауапкерге жазалаушы өтемақы қолдануға мүмкіндік береді. Жазалаушы өтемақы зардап шеккен адамдардың шығынын өтеуге арналған өтемдік төлемдерге қосымша болып табылады. Гловердің мысалындағыдай, өнім жарақатқа әкеліп, талап қоюшылар компанияны сотқа беріп, жеңіске жеткенде, оларға медициналық шоттарды және кез келген жоғалған жалақыны төлеу үшін ақша беріледі. Бірақ олар жауапкерге және соған ұқсас компанияларға ескерту жасауға арналған жазалаушы өтемақы да алуы мүмкін. General Assistance компаниясының бұл істегі мінез-құлқы анық айыптауға лайық; ол алқабилер негізді түрде жазалаушы өтемақы қолдана алатын әрекеттер ауқымына жатады.
Жазалаушы өтемақы институтына қатысты негізгі мәселе олардың болжап болмайтындығы болды. Бірдей құқық бұзушылық өте қарапайымнан өте үлкенге дейінгі мөлшердегі өтемақылармен жазалануы мүмкін. Осы кітаптың терминологиясын қолдана отырып, біз жүйені шулы деп айтар едік. Жазалаушы өтемақы туралы сұраныстар жиі қабылданбайды, тіпті олар қабылданған күннің өзінде, төлемдер өтемдік шығындарға көп нәрсе қоспайды. Дегенмен, таңқаларлық ерекшеліктер бар және алқабилер кейде тағайындайтын өте үлкен сомалар таңқаларлық әрі негізсіз болып көрінеді. Жиі келтірілетін мысал — жаңа BMW көлігінің қайта боялғанын жасырғаны үшін автосалонға салынған 4 миллион долларлық жазалаушы айыппұл.
Жазалаушы өтемақыларды зерттеу барысында 899 қатысушыдан Джоан Гловердің ісін және басқа тоғыз ұқсас істі бағалау сұралды — олардың барлығында белгілі бір зиян шеккен және бұған жауапты деп саналатын компанияны сотқа берген талап қоюшылар болды. Сізден айырмашылығы, қатысушылар барлық он іс бойынша үш сұрақтың біреуіне ғана (ашу-ыза, жазалау ниеті немесе доллар сомасы) жауап берді. Қатысушылар одан әрі шағын топтарға бөлініп, әрқайсысына әр істің бір нұсқасы берілді. Әр түрлі нұсқаларда талап қоюшының шеккен зияны мен жауапкер компанияның табысы өзгертіліп отырды. Барлығы жиырма сегіз сценарий болды. Біздің мақсатымыз — жазалаушы өтемақылардың психологиясы туралы теорияны тексеру және осы құқықтық институттағы шудың негізгі көзі ретіндегі ақшалай шкаланың (бұл жерде доллардың) рөлін зерттеу болды.
Ашу-ыза гипотезасы
Әділетті жазаны қалай анықтау керек екені туралы философтар мен заңгерлер ғасырлар бойы таласып келеді. Біздің гипотезамыз бойынша, философтар үшін қиын сұрақ қарапайым адамдар үшін өте оңай, өйткені олар қиын сұрақты оңай сұрақпен алмастыру арқылы тапсырманы жеңілдетеді. General Assistance компаниясын қаншалықты жазалау керек деген сұраққа бірден жауап беретін оңай сұрақ: «Мен қаншалықты ашулымын? » Осыдан кейін тағайындалатын жазаның қарқындылығы ашу-ызаның қарқындылығына сәйкестендіріледі.
Бұл ашу-ыза гипотезасын тексеру үшін біз әр түрлі қатысушылар топтарынан жазалау ниеті немесе ашу-ыза туралы сұраққа жауап беруді сұрадық. Содан кейін біз зерттеуде қолданылған жиырма сегіз сценарий бойынша екі сұрақтан алынған орташа рейтингтерді салыстырдық. Алмастыру идеясынан күткеніміздей, ашу-ыза мен жазалау ниетінің орташа рейтингтері арасындағы корреляция мінсізге жақын 0. 98 (PC = 94%) болды. Бұл корреляция ашу-ыза гипотезасын растайды: ашу-ыза эмоциясы жазалау ниетінің негізгі анықтаушы факторы болып табылады.
Ашу-ыза — жазалау ниетінің негізгі қозғаушы күші, бірақ жалғыз ол емес. Джоанның оқиғасында ашу-ызаны бағалағаннан көрі, жазалау ниетін бағалағанда көбірек назар аударған бірдеңені байқадыңыз ба? Егер байқасаңыз, бұл оның шеккен зияны деп ойлаймыз. Сіз іс-әрекеттің оның салдарын білмей-ақ ашу тудыратынын не тудырмайтынын айта аласыз; бұл жағдайда General Assistance компаниясының әрекеті, әрине, ашу тудырады. Ал жазалау ниеті туралы интуициялардың «көзге көз» принципінде қарапайым түрде білдірілген жазалаушы сипаты бар. Кек алуға деген ұмтылыс неліктен кісі өлтіруге оқталу мен кісі өлтіру заң және алқабилер тарапынан әр түрлі қарастырылатынын түсіндіреді; нысанасына тигізе алмаған сәтсіз қанішер азырақ жазаланады.
Зиянның шынымен де жазалау ниетіне әсер етіп, бірақ ашу-ызаға әсер етпейтінін анықтау үшін біз респонденттердің әр түрлі топтарына Джоан Гловер ісінің және басқа бірнеше істердің «ауыр зиян» және «жеңіл зиян» нұсқаларын көрсеттік. Ауыр зиян нұсқасы — сіз көрген нұсқа. Жеңіл зиян нұсқасында Джоан «ауруханада бірнеше күн өткізуге мәжбүр болды және қазір кез келген таблеткадан қатты қорқады. Ата-анасы оған тіпті пайдалы дәрілерді, мысалы, дәрумендерді, аспиринді немесе суық тиюге қарсы дәрілерді бергісі келгенде, ол бақырып жылап, қорқатынын айтады». Бұл нұсқа бала үшін травматикалық тәжірибені сипаттайды, бірақ сіз оқыған бірінші нұсқадағы ұзақ мерзімді медициналық зақымға қарағанда зиян деңгейі әлдеқайда төмен. Күткеніміздей, ашу-ызаның орташа рейтингтері ауыр зиян (4. 24) және жеңіл зиян (4. 19) нұсқалары үшін дерлік бірдей болды. Ашу-ыза үшін тек жауапкердің мінез-құлқы маңызды; оның салдары маңызды емес. Керісінше, жазалау ниетінің рейтингтері ауыр зиян үшін орташа есеппен 4. 93 және жеңіл зиян үшін 4. 65 болды, бұл аз, бірақ статистикалық тұрғыдан сенімді айырмашылық. Ақшалай өтемақының медианалық мөлшері ауыр зиян нұсқасы үшін екі миллион доллар, ал жеңіл нұсқасы үшін бір миллион доллар болды. Осындай нәтижелер басқа бірнеше істер бойынша да алынды.
Бұл тұжырымдар пайымдау процесінің негізгі ерекшелігін көрсетеді: пайымдау тапсырмасының дәлелдемелердің әр түрлі аспектілеріне салмақ беруге тигізетін нәзік әсері. Жазалау ниеті мен ашу-ызаны бағалаған қатысушылар әділеттілік жазалаушы болуы керек пе деген философиялық мәселе бойынша позиция ұстанып жатқандарын білген жоқ. Олар тіпті істің түрлі белгілеріне салмақ тағайындап жатқандарын да сезбеді. Соған қарамастан, олар ашу-ызаны бағалау кезінде зиянға нөлге жуық салмақ берсе, жазаны анықтау кезінде дәл осы факторға айтарлықтай салмақ берді. Қатысушылардың оқиғаның тек бір нұсқасын көргенін еске түсіріңіз; олардың ауыр зиян үшін жоғарырақ жаза тағайындауы нақты салыстыру болған жоқ. Бұл екі жағдайдағы автоматты сәйкестендіру операциясының нәтижесі болды. Қатысушылардың жауаптары баяу ойлауға қарағанда, көбіне тез ойлауға сүйенді.
Шулы шкалалар
Зерттеудің екінші мақсаты жазалаушы өтемақылардың неліктен шулы екенін анықтау болды. Біздің гипотезамыз бойынша, алқабилер әдетте жауапкерді қаншалықты қатаң жазалағысы келетіні туралы келіседі, бірақ өздерінің жазалау ниетін доллар шкаласына аударуда айтарлықтай алшақтыққа жол береді.
Зерттеу дизайны бізге бір іс бойынша үш шкаладағы: ашу-ыза, жазалау ниеті және доллар түріндегі шығындар бойынша пайымдаулардағы шу мөлшерін салыстыруға мүмкіндік береді. Шуды өлшеу үшін біз 6-тараудағы федералдық судьялардың шу аудитінің нәтижелерін талдау үшін қолданылған әдісті қолданамыз. Біз сол талдаудағыдай, іс бойынша жеке пайымдаулардың орташа мәнін біржақты емес, әділетті мән ретінде қарастыруға болады деп есептейміз. (Бұл талдау мақсатындағы болжам; біз оның қате болуы мүмкін екенін ескертеміз). Идеал әлемде белгілі бір шкаланы қолданатын барлық алқабилер әрбір істі бағалауда келіскен болар еді. Орташа пайымдаудан кез келген ауытқу қате деп есептеледі және бұл қателер жүйелік шудың көзі болып табылады.
6-тарауда атап өткеніміздей, жүйелік шуды <span data-term="true">деңгейлік шу</span> (төрешілердің жалпы қаталдық деңгейіндегі айырмашылық) және <span data-term="true">үлгілік шу</span> (нақты бір жағдайға тән бағалаудағы ауытқу) деп бөлуге болады. Мұндағы деңгейлік шу — алқабилердің жалпы қаншалықты қатал екендігіндегі өзгермелілік. Үлгілік шу — нақты бір алқабидің жекелеген істерге өз орташа көрсеткішіне қатысты қалай жауап беретіндігіндегі өзгермелілік. Сондықтан біз шешімдердің жалпы дисперсиясын үш элементке бөле аламыз:
Шешімдер дисперсиясы = Әділ жаза дисперсиясы + (Деңгейлік шу)² + (Үлгілік шу)²
Бұл талдау — шешімдер дисперсиясын үш мүшеге жіктеу — ызалану, жазалау ниеті және ақшалай өтемақы туралы үш бөлек шешім үшін жеке-жеке жүргізілді.
13-суретте нәтижелер көрсетілген. Ең аз шулы шкала — жазалау ниеті, мұнда жүйелік шу дисперсияның 51%-ын құрайды, яғни шу мен әділдік шамамен тең. Ызалану шкаласы айтарлықтай шулырақ: 71% шу. Ал ақшалай шкала — ең нашары: шешімдердегі дисперсияның толық 94%-ы — шу!
Бұл айырмашылықтар таңғалдырады, себебі мазмұны жағынан үш шкала бір-біріне өте ұқсас. Бұған дейін біз ызалану мен жазалау ниетінің әділ мәндері, «ызалану гипотезасында» айтылғандай, бір-бірімен дерлік толық сәйкес келетінін көрдік. Жазалау ниеті мен ақшалай өтемақы мөлшері дәл бір сұраққа — General Assistance компаниясын қаншалықты қатаң жазалау керек дегенге — тек әртүрлі өлшем бірліктерінде жауап береді. 13-суреттегі үлкен айырмашылықтарды қалай түсіндіруге болады?
Ызаланудың аса дәл шкала емес екендігімен келісетін шығармыз. Расында да, «толықтай қолайлы» мінез-құлық деген ұғым бар, бірақ егер General Assistance немесе басқа жауапкерлерге деген ашудың шегі болса, ол шек өте бұлыңғыр. Іс-әрекеттің «мүлдем шектен шыққан» болуы нені білдіреді? Шкаланың жоғарғы жағындағы айқындықтың болмауы шудың туындауын болдырмай қоймайды.
Жазалау ниеті нақтырақ. «Қатаң жаза» — «мүлдем шектен шыққан» дегеннен көрі дәлірек, өйткені «өте қатаң жаза» заңмен белгіленген максимуммен шектеледі. Сіз кінәліні «қатаң жазалағыңыз» келсе де, мысалы, General Assistance бас директоры мен оның бүкіл басқару тобын өлім жазасына кесуді ұсына алмайсыз. (Деп үміттенеміз. ) Жазалау ниеті шкаласы екіұшты емес, өйткені оның жоғарғы шегі нақтырақ көрсетілген. Күткеніміздей, ол азырақ шулы.

13-СУРЕТ: Шешім дисперсиясының құрамдас бөліктері
Ызалану мен жазалау ниеті сөздік белгілермен азды-көпті анықталған ұқсас рейтингтік шкалалармен өлшенді. Ақшалай шкала басқа топқа жатады және ол әлдеқайда проблемалы.
Долларлар және зәкірлер
Біздің академиялық мақаламыздың тақырыбы оның негізгі хабарын білдіреді: «Ортақ ыза және тұрақсыз өтемақылар: Жазалаушы шығындар психологиясы». Біздің эксперименттік алқабилер арасында жазалау ниетінің рейтингтері бойынша айтарлықтай келісім болды; бұл рейтингтер негізінен ызаланумен түсіндірілді. Дегенмен, ақшалай өлшем сот залындағы жағдайды ең жақын имитациялады және ол қабылданбайтын деңгейде шулы болды.
Мұның себебі жұмбақ емес. Егер сіз Джоан Гловер ісі бойынша нақты ақшалай шығын сомасын көрсетсеңіз, сіз таңдаған санның негізінен ерікті екендігін сезінгеніңіз анық. Еріктілік сезімі маңызды ақпаратты береді: ол сізге басқа адамдардың да әртүрлі ерікті шешімдер қабылдайтынын және бұл бағалаулардың өте шулы болатынын айтады. Бұл ақшалай өтемақылар жататын шкалалар тобына тән сипат болып шықты.
Гарвардтың аты аңызға айналған психологы С. С. Стивенс адамдардың көптеген субъективті тәжірибелер мен көзқарастардың қарқындылық қатынастары (шамалардың бір-біріне пропорционалдық байланысы) туралы ортақ интуициясы бар екенін ашты. Олар жарықты басқа біреуінен «екі есе жарық» етіп реттей алады және он айлық түрме жазасының эмоционалдық мәні бір айлық жазадан он есе нашар емес екендігімен келіседі. Стивенс мұндай интуицияларға негізделген шкалаларды қатынастық шкалалар деп атады.
Ақша туралы интуициямыздың қатынастармен өрнектелетінін «Сараның жалақысы 60%-ға өсті! » немесе «Бай көршіміз бір түнде байлығының жартысынан айырылды» деген сияқты сөздерді оңай түсінетінімізден байқауға болады. Жазалаушы шығындардың ақшалай шкаласы — жазалау ниетін өлшеуге арналған қатынастық шкала. Басқа қатынастық шкалалар сияқты, оның мағыналы нөлі (нөл доллар) бар және жоғарғы жағы шектелмеген.
Стивенс қатынастық шкаланы (ақшалай шкала сияқты) бір аралық зәкір (арнайы термині — modulus, яғни тірек нүктесі) арқылы бекітуге болатынын анықтады. Өз зертханасында ол бақылаушыларға белгілі бір жарықты көрсетіп: «Бұл жарықтың жарықтығын 10 (немесе 50, немесе 200) деп атаңыз және басқа жарықтарға соған сәйкес сандар беріңіз» деген нұсқау беретін. Күтілгендей, бақылаушылардың әртүрлі жарықтарға берген сандары оларға қабылдау тапсырылған ерікті зәкірге пропорционал болды. 200 санына «байланған» бақылаушы, зәкірі 10 болған жағдаймен салыстырғанда 20 есе жоғары баға беретін; бақылаушы шешімдерінің стандартты ауытқуы да зәкірге пропорционал болатын.
13-тарауда біз зәкірлеудің (алғашқы ақпаратқа негізделу) қызықты мысалын сипаттадық: адамдардың бір зат үшін ақша төлеуге дайындығына олардан алдымен әлеуметтік сақтандыру нөмірінің соңғы екі цифрын (доллармен) төлейтін-төлемейтінін сұрау қатты әсер еткен. Тағы бір таңғаларлық нәтиже — бастапқы зәкір олардың басқа да көптеген заттар тізімі үшін ақша төлеуге дайындығына әсер етті. Сымсыз трекбол үшін үлкен сома төлеуге келіскен қатысушылар сымсыз пернетақта үшін де сәйкесінше үлкен сома төлеуге келісті. Адамдар тауарлардың абсолюттік құнына қарағанда, салыстырмалы құнына әлдеқайда сезімтал болып көрінеді. Зерттеу авторлары бір зәкірдің тұрақты әсерін жүйелі еріктілік (бастапқы шешім кездейсоқ болғанымен, кейінгілердің соған бағынуы) деп атады.
Джоан Гловер ісіндегі ерікті зәкірдің әсерін түсіну үшін осы тараудың басындағы мәтінде мынадай ақпарат бар деп есептейік:
Басқа фармацевтикалық компания қатысқан ұқсас істе құрбан болған кішкентай қыз жеңіл психологиялық жарақат алған (сіз бұған дейін оқыған зиянның жеңіл нұсқасындағыдай). Жазалаушы шығындар 1,5 миллион доллар болып белгіленді.
Байқасаңыз, General Assistance үшін жаза белгілеу мәселесі кенеттен әлдеқайда оңай болып қалды. Расында да, сіздің ойыңызға белгілі бір сома келген де болар. Джоанға келтірілген ауыр зиян мен басқа кішкентай қыз тартқан жеңіл зиян арасындағы контрастқа сәйкес келетін ақшалай өтемақылардың мультипликаторы (немесе қатынасы) бар. Сонымен қатар, сіз оқыған жалғыз зәкір (1,5 миллион доллар) жазаның бүкіл ақшалай шкаласын бекітуге жеткілікті. Енді сізге осы уақытқа дейін қарастырылған екі жағдайдан да ауыр немесе жеңіл істер үшін өтемақы белгілеу оңай.
Егер қатынастық шкала бойынша шешім қабылдау үшін зәкірлер қажет болса, адамдарға зәкір берілмегенде не болады? Стивенс жауабын айтты. Зерттеуші тарапынан нұсқаулық болмаған жағдайда, адамдар шкаланы бірінші рет қолданғанда ерікті таңдау жасауға мәжбүр болады. Осы сәттен бастап олар өздерінің алғашқы жауабын зәкір ретінде пайдаланып, шешімдерін жүйелі түрде қабылдайды.
Джоан Гловер ісі бойынша шығындарды белгілеудегі сіздің тапсырмаңыз зәкірсіз шкалалаудың бір мысалы екенін байқаған боларсыз. Стивенс зертханасындағы зәкірсіз бақылаушылар сияқты, сіз де General Assistance үшін дұрыс жаза туралы ерікті шешім қабылдадыңыз. Біздің жазалаушы шығындарды зерттеуімізге қатысушылар да дәл осындай мәселеге тап болды: олар да көрген алғашқы ісі бойынша бастапқы ерікті шешім қабылдауға мәжбүр болды. Алайда, сізден айырмашылығы, олар тек бір ерікті шешім қабылдаған жоқ: олар тағы тоғыз іс бойынша жазалаушы шығындарды белгілеуді жалғастырды. Бұл тоғыз шешім ерікті болған жоқ, өйткені оларды бастапқы зәкірлеуші шешіммен және, демек, бір-бірімен сәйкестендіруге болатын еді.
Стивенс зертханасының тұжырымдары адамдар шығарған зәкір олардың кейінгі ақшалай шешімдерінің абсолюттік мәндеріне үлкен әсер етуі керек, бірақ он істің салыстырмалы позицияларына ешқандай әсер етпейтінін көрсетеді. Бастапқы үлкен шешім барлық басқа шешімдердің олардың салыстырмалы мөлшеріне әсер етпестен, пропорционалды түрде үлкен болуына әкеледі. Бұл пайымдау таңғаларлық қорытындыға жетелейді: доллармен бағалаулар үмітсіз шулы болып көрінгенімен, олар іс жүзінде судьялардың жазалау ниетін көрсетеді. Бұл ниеттерді анықтау үшін біз тек абсолютті ақшалай мәндерді салыстырмалы ұпайлармен алмастыруымыз керек.
Бұл идеяны тексеру үшін біз әрбір ақшалай өтемақыны адамның он шешімі арасындағы оның орнымен (рангісімен) алмастырғаннан кейін шуды қайта талдадық. Ең жоғары ақшалай өтемақы 1 ұпай, келесісі 2 ұпай және т. с. с. болып есептелді. Ақшалай өтемақыларды рангтерге айналдыру алқаби деңгейіндегі барлық қателерді жояды, себебі рангтердің 1-ден 10-ға дейінгі үлестірімі, сирек кездесетін теңдіктерді есептемегенде, бәрі үшін бірдей. (Егер сізді қызықтырса, сауалнаманың бірнеше нұсқасы болды, өйткені әр адам жиырма сегіз сценарийдің онын бағалады. Біз талдауды бірдей он сценарийге жауап берген қатысушылардың әр тобы үшін жеке жүргіздік және орташа көрсеткішті береміз. )
Нәтижелер таңғаларлық болды: шешімдердегі шудың үлесі 94%-дан 49%-ға дейін төмендеді (14-сурет). Ақшалай өтемақыларды рангтерге айналдыру алқабилердің әртүрлі істердегі тиісті жаза туралы іс жүзінде айтарлықтай келісімде болғанын көрсетті. Шынында да, ақшалай өтемақылардың рангілері бастапқы жазалау ниетінің рейтингтеріне қарағанда біршама азырақ шулы болды.

14-СУРЕТ: Мән бойынша шу және ранг бойынша шу
Өкінішті қорытынды
Нәтижелер біз сипаттаған теориямен сәйкес келеді: барлық істер бойынша ақшалай өтемақылар әрбір алқаби өзі көрген бірінші іс үшін таңдаған ерікті санға негізделген. Істердің салыстырмалы рангісі көзқарастарды әділ дәлдікпен көрсетеді және сондықтан өте шулы емес, бірақ ақшалай өтемақылардың абсолюттік мәндері негізінен мағынасыз, өйткені олар бірінші істе таңдалған ерікті санға байланысты.
Бір қызығы, алқабилер нақты сот процестерінде бағалайтын іс — олар көретін бірінші және жалғыз іс. Американдық құқықтық тәжірибе азаматтық алқабилерден ешқандай бағыттаушы зәкірдің көмегінсіз бір іс үшін ақшалай өтемақы белгілеуді талап етеді. Заң алқабилерге басқа істердегі жазалаушы өтемақылардың мөлшері туралы кез келген ақпаратты жеткізуге тікелей тыйым салады. Заңдағы жанама болжам — алқабилердің әділдік сезімі оларды құқық бұзушылықты қарастырудан тікелей дұрыс жазаға алып келеді. Бұл болжам психологиялық тұрғыдан мағынасыз — ол адамдарда жоқ қабілетті бар деп есептейді. Әділет институттары оны жүзеге асыратын адамдардың шектеулерін мойындауы керек.
Жазалаушы шығындардың мысалы — экстремалды жағдай; кәсіби шешімдер мұндай үмітсіз екіұшты шкалалармен сирек өрнектеледі. Соған қарамастан, екіұшты шкалалар жиі кездеседі, бұл жазалаушы шығындарды зерттеудің бизнесте, білім беруде, спортта, үкіметте және басқа жерлерде қолданылатын екі жалпы сабағы бар екенін білдіреді. Біріншіден, шкаланы таңдау шешімдердегі шу мөлшеріне үлкен әсер етуі мүмкін, өйткені екіұшты шкалалар шулы болады. Екіншіден, мүмкін болған жағдайда абсолюттік шешімдерді салыстырмалы шешімдермен алмастыру шуды азайтуы ықтимал.
Шкалалар туралы сөйлескенде
«Біздің шешімдерімізде шу көп. Бұл шкаланы әртүрлі түсінетіндігімізден болуы мүмкін бе? »
«Шкалада тірек нүктесі болатын зәкірлік іс туралы келісе аламыз ба? »
«Шуды азайту үшін, мүмкін, біз шешімдерімізді рангілеумен алмастыруымыз керек шығар? » [/DIALOGUE]
16-ТАРАУ
Үлгілер
14-тарауда колледждің орташа балын (GPA) болжауға тырысқан зерек бала Джули есіңізде ме? Міне, толығырақ сипаттама.
Джули жалғыз бала болатын. Әкесі табысты заңгер, анасы сәулетші еді. Джули шамамен үш жаста болғанда, әкесі аутоиммунды ауруға шалдығып, үйде жұмыс істеуге мәжбүр болды. Ол Джулимен көп уақыт өткізіп, оған шыдамдылықпен оқуды үйретті. Төрт жасында ол еркін оқып жүрді. Әкесі оған арифметиканы да үйретпек болды, бірақ ол тақырып Джулиге қиын соқты. Джули бастауыш мектепте жақсы оқушы болды, бірақ эмоционалды түрде мұқтаж және көпшілік арасында онша танымал емес еді. Ол жалғыз көп уақыт өткізетін және сүйікті ағасымен бірге құстарды бақылағаннан кейін құстарға құмар болып кетті.
Ол он бір жаста болғанда ата-анасы ажырасып кетті және Джули бұны ауыр қабылдады. Оның бағалары төмендеп, мектепте жиі ашуға бой алдыратын болды. Жоғары мектепте ол кейбір пәндерден, соның ішінде биология мен шығармашылық жазудан өте жақсы оқыды. Ол физикадан озық шығып, бәрін таңғалдырды. Бірақ ол басқа пәндерінің көбіне немқұрайлы қарап, жоғары мектепті «В» (жақсы) деген бағамен бітірді.
Өзі тапсырған беделді оқу орындарына қабылданбаған Джули, соңында қоршаған ортаны қорғау мамандығы бойынша жақсы мемлекеттік мектепте оқыды. Колледждегі алғашқы екі жылында ол жиі эмоционалдық қиындықтарға тап болып, жүйелі түрде марихуана шекті. Алайда, төртінші семестрінде оның медициналық мектепке баруға деген күшті ықыласы оянып, оқуына әлдеқайда салмақты қарай бастады.
Джулидің бітіру GPA-і туралы сіздің ең жақсы болжамыңыз қандай?
Проблемалар: Қиын және Оңай
Әлбетте, бұл мәселе (оны Джули 2. 0 деп атайық) әлдеқайда қиындай түсті. Джули 1. 0 туралы білетініңіз тек оның төрт жасында оқи алғандығы ғана еді. Бір ғана дерек болғанда, сәйкестендіру күші жұмыс істеп, оның GPA-і туралы интуитивті баға ойыңызға тез келді.
Егер сізде бір бағытты нұсқайтын бірнеше дерек болса, сәйкестендіру әлі де қолжетімді болар еді. Мысалы, джаз ойнайтын бухгалтер Биллдің сипаттамасын оқығанда, сіздегі барлық ақпарат («қиялы нашар», «математикаға мықты», «әлеуметтік ғылымдарға әлсіз») біртұтас, стереотиптік суретті салды. Сол сияқты, егер Джули 2. 0-нің өміріндегі оқиғалардың көбі зеректік пен жоғары жетістіктер тарихына сәйкес келсе (мүмкін «орташа» нәтижені көрсететін бірнеше дерекпен бірге), тапсырма сізге соншалықты қиын болмас еді. Қолда бар дәлелдер біртұтас суретті салғанда, біздің жылдам «1-жүйе» ойлауымыз оны оңай түсінеді. Мұндай қарапайым бағалау мәселелері оңай шешіледі және адамдардың көбі олардың шешімімен келіседі.
Джули 2. 0-де олай емес. Бұл мәселені қиындататын нәрсе — бірнеше қарама-қайшы деректердің болуы. Қабілет пен мотивацияның белгілері бар, бірақ сонымен бірге мінез-құлықтағы әлсіздіктер мен орташа жетістіктер де бар. Оқиға жан-жаққа шашырап жатқандай. Элементтер біртұтас интерпретацияға сәйкес келмегендіктен, оны түсіну оңай емес. Әрине, жүйесіздік оқиғаны шындыққа жанаспайтын немесе сенімсіз етпейді. Өмір біз ол туралы айтқымыз келетін әңгімелерден әлдеқайда күрделірек.
Бірнеше қарама-қайшы деректер қиын бағалау мәселелерін анықтайтын екіұштылықты тудырады. Екіұштылық күрделі мәселелердің қарапайымдарға қарағанда неге шулырақ екенін де түсіндіреді. Ереже қарапайым: егер бір нәрсені көрудің бірнеше жолы болса, адамдар оны әртүрлі көреді. Адамдар өз әңгімелерінің өзегін құрастыру үшін әртүрлі дәлелдерді таңдай алады, сондықтан көптеген ықтимал қорытындылар бар. Егер сізге Джули 2. 0-ні түсіндіретін оқиға құрастыру қиын болса, басқа оқырмандар сіздікінен өзгеше шешімдерді негіздейтін басқа оқиғалар құрастыратынына сенімді бола аласыз. Бұл — үлгілік шуды тудыратын өзгермелілік.
Сіз шешіміңізге қашан сенімді боласыз? Екі шарт орындалуы керек: сіз сенетін оқиға толықтай жүйелі болуы керек және тартымды баламалар болмауы керек. Таңдалған интерпретацияның барлық бөлшектері оқиғаға сәйкес келіп, бір-бірін толықтырғанда толық жүйелілікке қол жеткізіледі. Әрине, сіз сәйкес келмейтін нәрселерді елемей немесе түсіндіріп жіберу арқылы да, талғампаз болмаса да, жүйелілікке қол жеткізе аласыз. Балама интерпретациялармен де солай. Бағалау мәселесін «шешкен» нағыз сарапшы өз түсіндірмесінің неге дұрыс екенін ғана емес; ол басқа оқиғалардың неге қате екенін де еркін түсіндіріп бере алады. Бұл жерде де адам баламаларды қарастырмау немесе оларды белсенді түрде басып тастау арқылы дәл сондай күшті, бірақ сапасы төмен сенімділікке ие бола алады.
Бұл сенімділік көзқарасының негізгі нәтижесі — шешімге деген субъективті сенімділік оның дәлдігіне ешқандай кепілдік бермейді. Сонымен қатар, балама интерпретацияларды басып тастау — қабылдаудағы жақсы құжатталған процесс — біз келісім иллюзиясы (2-тарауды қараңыз) деп атаған нәрсені тудыруы мүмкін. Егер адамдар өз қорытындыларына балама нұсқаларды елестете алмаса, олар басқа бақылаушылар да дәл осындай қорытындыға келуі керек деп табиғи түрде есептейді. Әрине, бәріміздің бірдей барлық шешімдерімізге сенімді болу бақытымыз бұйырмаған және бәріміз де белгісіздікті бастан кешірдік, бәлкім, жақында ғана Джули 2. 0 туралы оқығанда. Біз әрдайым өте сенімді емеспіз, бірақ көп жағдайда болуымыз керек болғаннан гөрі сенімдірекпіз.
Үлгілік шу: Тұрақты немесе Өтпелі
Біз үлгілік қатені — жеке адамның белгілі бір істі бағалауындағы, іс пен төрешінің жеке әсерлерінің қосындысымен түсіндіруге болмайтын қате деп анықтадық. Экстремалды мысал ретінде, әдетте жұмсақ төрешінің сотталушының белгілі бір түріне (айталық, жол қозғалысы ережесін бұзғандарға) қатысты ерекше қатал болуын келтіруге болады. Немесе, әдетте сақ инвестор қызықты стартаптың жоспарын көргенде өзінің сақтығын ұмытып кетуі мүмкін. Әрине, үлгілік қателердің көбі экстремалды емес: біз жұмсақ төрешінің қайталап қылмыс жасаушылармен жұмыс істегенде әдеттегіден қатаңдау болғанын немесе жас әйелдерге үкім шығарғанда әдеттегіден де жұмсақ болғанын көргенде қалыпты үлгілік қатені байқаймыз.
Үлгілік қателер өтпелі және тұрақты факторлардың жиынтығынан туындайды. Өтпелі факторларға біз жағдайлық шудың (сол сәттегі көңіл-күй) көздері ретінде сипаттаған факторлар жатады, мысалы, төрешінің сол сәттегі жақсы көңіл-күйі немесе оның ойында жүрген соңғы сәтсіз оқиға. Басқа факторлар тұрақтырақ — мысалы, жұмыс берушінің белгілі бір университеттерді бітірген адамдарға деген ерекше қызығушылығы немесе дәрігердің пневмониямен ауыратын адамдарды ауруханаға жатқызуға деген ерекше бейімділігі. Біз бір шешімдегі қатені сипаттайтын қарапайым теңдеуді жаза аламыз:
Үлгілік қате = Тұрақты үлгілік қате + Өтпелі (жағдайлық) қате
Тұрақты үлгілік қате мен өтпелі (жағдайлық) қате тәуелсіз және өзара байланысты емес болғандықтан, біз олардың дисперсияларын талдау үшін жоғарыдағы теңдеуді кеңейте аламыз:
(Үлгілік шу)² = (Тұрақты үлгілік шу)² + (Жағдайлық шу)²
Қате мен шудың басқа құрамдас бөліктері сияқты, біз бұл теңдеуді тік бұрышты үшбұрыштың қабырғаларындағы квадраттардың қосындысы ретінде графикалық түрде көрсете аламыз (15-сурет):

15-СУРЕТ: Үлгілік шуды жіктеу
Тұрақты үлгілік шудың қарапайым жағдайы ретінде рейтингтер жиынтығы негізінде басқарушылардың болашақ жұмысын болжайтын рекрутерлерді қарастырайық. 9-тарауда біз «төрешінің моделі» туралы айтқанбыз. Жеке рекрутердің моделі әрбір рейтингке салмақ береді, бұл сол рекрутердің шешімдеріндегі маңыздылығына сәйкес келеді. Салмақтар рекрутерлер арасында әртүрлі болады: біреуі үшін көшбасшылық, екіншісі үшін қарым-қатынас дағдылары маңыздырақ болуы мүмкін. Мұндай айырмашылықтар рекрутерлердің кандидаттарды рангілеуіндегі өзгермелілікті — біз тұрақты үлгілік шу деп атайтын нәрсені тудырады.
Жекелеген жағдайларға берілетін дербес реакциялар да тұрақты, бірақ өте ерекше үлгілерді (патерндерді) тудыруы мүмкін. Джулидің оқиғасының кейбір тұстарына неліктен басқаларына қарағанда көбірек көңіл бөлгеніңізді ойлап көріңізші. Оқиғаның кейбір детальдары сіздің өмірлік тәжірибеңізбен үндес болуы мүмкін. Бәлкім, Джули сізге жас кезінен байқалған мінез-құлық кемшіліктерінің кесірінен үнемі сәттілікке жақын тұрып, соңында бәрібір сүріне беретін жақын туысыңызды еске түсіретін шығар. Керісінше, Джулидің тарихы қиын жасөспірімдік шақты бастан өткеріп, соңында медициналық оқуға түскен және қазір табысты маман болып отырған жақын досыңыз туралы естеліктерді оятуы мүмкін. Джулидің әртүрлі адамдарда тудыратын ассоциациялары идиосинкразиялық (тек бір адамға ғана тән ерекшелік) және болжап болмайтын сипатта, бірақ олар тұрақты болуы ықтимал: егер сіз Джулидің оқиғасын өткен аптада оқысаңыз да, сол адамдарды еске алып, оның тарихын дәл осылай жеке көзқараспен қабылдаған болар едіңіз.
Төрелік сапасындағы жеке айырмашылықтар — қалыпты шудың (pattern noise) тағы бір көзі. Өзі де білмейтін (ешкім де сезбейтін) болашақты көретін сиқырлы қабілеті бар болжаушыны елестетіңіз. Оның дәлдігі оны көп жағдайда орташа болжамнан алшақтатады. Нақты нәтижелер болмаған жағдайда, бұл ауытқулар қалыпты қателер ретінде қабылданады. Төреліктерді тексеру мүмкін болмағанда, жоғары дәлдік қалыпты шу сияқты көрінеді.
Қалыпты шу сонымен қатар істің әртүрлі қырлары туралы негізді төрелік жасау қабілетіндегі жүйелі айырмашылықтардан да туындайды. Кәсіби спорттық командаларға іріктеу процесін қарастырайық. Жаттықтырушылар ойынның әртүрлі аспектілеріндегі дағдыларға, дәрігерлер жарақатқа бейімділікке, ал психологтар мотивация мен төзімділікке назар аударуы мүмкін. Осы әртүрлі мамандар бір ойыншыларды бағалағанда, біз айтарлықтай көлемдегі қалыпты шуды күте аламыз. Сол сияқты, бірдей жалпы рөлдегі кәсіби мамандар төрелік міндетінің кейбір тұстарына басқаларына қарағанда шеберірек болуы мүмкін. Мұндай жағдайларда қалыпты шуды қателік емес, адамдардың біліміндегі әртүрлілік деп сипаттаған дұрыс.
Кәсіби мамандар шешімді өз бетінше қабылдағанда, дағдылардағы ауытқушылық жай ғана шу болып табылады. Дегенмен, басшылықта төрелікті бірге жасайтын командалар құру мүмкіндігі болса, дағдылардың әртүрлілігі әлеуетті активке айналады, өйткені әртүрлі мамандар төреліктің әртүрлі қырларын қамтып, бірін-бірі толықтырады. Біз бұл мүмкіндікті және оны пайдалану үшін не қажет екенін 21-тарауда талқылаймыз.
Алдыңғы тарауларда біз сақтандыру компаниясының клиенті немесе судья тағайындалған сотталушы кезігетін екі лотерея туралы айтқан болатынбыз. Енді бірінші лотерея (әріптестер тобынан бір кәсіби маманды таңдау) сол маманның төреліктерінің орташа деңгейінен (деңгейлік қателік) әлдеқайда көп нәрсені анықтайтынын көре аламыз. Лотерея сонымен қатар осы нақты маманға ғана тән құндылықтардың, артық көрулердің, сенімдердің, естеліктердің, тәжірибелер мен ассоциациялардың калейдоскопиялық жиынтығын таңдайды. Кез келген төрелік жасағанда, сіз де өзіңіздің «жүгіңізді» ала жүресіз. Сіз жұмыста қалыптасқан ойлау дағдыларыңызбен және тәлімгерлеріңізден алған даналығыңызбен келесіз. Өзіңізге деген сенімділікті арттырған табыстарыңыз бен қайталамауға тырысатын қателіктеріңізді ала келесіз. Миыңыздың бір жерінде сіз есте сақтаған ресми ережелер, ұмытып қалғандарыңыз және елемеуге болады деп үйренгендеріңіз бар. Бұл жағынан ешкім сізге дәл ұқсамайды; сіздің тұрақты қалыпты қателіктеріңіз тек сізге ғана тән.
Екінші лотерея — бұл сіздің төрелік жасайтын сәтіңізді, көңіл-күйіңізді және төрелігіңізге әсер етпеуі тиіс, бірақ әсер ететін басқа да бөгде жағдайларды анықтайтын лотерея. Бұл лотерея сәттік шуды (occasion noise – белгілі бір жағдайға байланысты уақытша ауытқу) тудырады. Мысалы, Джулидің ісін оқымас бұрын, колледж кампустарындағы есірткі қолдану туралы газет мақаласын оқыдыңыз деп елестетіңіз. Мақалада заң факультетіне түсуге бел байлаған және көп еңбек еткен, бірақ колледждің алғашқы жылдарында есірткі қолдану салдарынан болған олқылықтың орнын толтыра алмаған дарынды студенттің тарихы баяндалған. Бұл оқиға жадыңызда жаңа болғандықтан, Джулидің жалпы мүмкіндіктерін бағалау кезінде оның марихуана шегу әдетіне көбірек көңіл бөлуіңізге себеп болады. Дегенмен, егер сіз Джули туралы сұраққа бірнеше аптадан кейін кезіксеңіз, бұл мақала есіңізде болмас еді (және егер сіз бұл істі кеше оқысаңыз, ол туралы білмес те едіңіз). Газет мақаласын оқудың әсері өтпелі; бұл — сәттік шу.
Бұл мысал көрсеткендей, тұрақты қалыпты шу мен біз сәттік шу деп атайтын құбылмалы нұсқаның арасында өткір шекара жоқ. Негізгі айырмашылық — адамның істің кейбір тұстарына деген ерекше сезімталдығының өзі тұрақты ма, әлде уақытша ма, сонда. Қалыпты шудың қозғаушы күштері біздің жеке тәжірибеміз бен құндылықтарымыздан бастау алса, біз бұл үлгінің тұрақты болуын, яғни біздің бірегейлігіміздің көрінісі болуын күте аламыз.
Тұлғалық ұқсастық
Белгілі бір сипаттарға немесе олардың комбинацияларына нақты адамдардың беретін жауаптарындағы бірегейлік идеясы бірден интуитивті түрде түсінікті бола бермейді. Оны түсіну үшін бәрімізге жақсы таныс тағы бір күрделі сипаттар жиынтығын — айналамыздағы адамдардың тұлғалық қасиеттерін қарастыруға болады. Шын мәнінде, төрешінің іс бойынша шешім қабылдауын тұлғалық зерттеулердің кеңірек тақырыбының — адамның белгілі бір жағдайдағы іс-әрекетінің — жеке жағдайы ретінде қарастыру керек. Осы кең ауқымды тақырыпты ондаған жылдар бойы қарқынды зерттеуден төрелік туралы үйренетін нәрсе көп.
Психологтар бұрыннан тұлғадағы жеке айырмашылықтарды түсінуге және өлшеуге тырысып келеді. Адамдар бір-бірінен көптеген жағынан ерекшеленеді; адамды сипаттай алатын терминдерді сөздіктен іздеудің алғашқы әрекеті он сегіз мың сөзді анықтаған. Бүгінгі таңда тұлғаның басым моделі — Үлкен бестік (тұлғаны сипаттайтын бес негізгі қасиет моделі) моделі қасиеттерді бес топқа біріктіреді: экстраверсия, жағымдылық, ұқыптылық (conscientiousness – жауапкершілік және ұйымшылдық), тәжірибеге ашықтық, невротизм (эмоционалды тұрақсыздық). Үлкен бестіктің әрқайсысы бірқатар ерекшеленетін қасиеттерді қамтиды. Тұлғалық қасиет нақты іс-әрекеттердің болжаушысы ретінде түсініледі. Егер біреу ұқыпты деп сипатталса, біз одан тиісті мінез-құлықты (уақытында келу, уәдеде тұру және т. б. ) күтеміз. Егер Эндрю агрессивтілік көрсеткіші бойынша Брэдтен жоғары ұпай жинаса, көп жағдайда Эндрю Брэдке қарағанда агрессивтірек әрекет ететінін байқауымыз керек. Дегенмен, іс жүзінде нақты іс-әрекеттерді болжау үшін жалпы қасиеттердің негізділігі айтарлықтай шектеулі; 0. 30 корриляциясы (PC = 60%) жоғары деп саналады.
Ортақ түсінік бойынша, мінез-құлық тұлғалық қасиеттерге байланысты болғанымен, оған жағдайлар да қатты әсер етеді. Кейбір жағдайларда ешкім агрессивті емес, ал басқа жағдайларда бәрі агрессивті. Қайғыға батқан досын жұбатқанда Эндрю де, Брэд те агрессивті әрекет етпейді; бірақ футбол ойынында екеуі де агрессия танытады. Қысқасы — бұл таңқаларлық емес — мінез-құлық тұлғалық қасиеттер мен жағдайлардың функциясы болып табылады.
Адамдарды бірегей және шексіз қызықты ететін нәрсе — тұлға мен жағдайдың бұл қосылуы механикалық, аддитивті (жай ғана қосылатын) функция емес. Мысалы, агрессияны көбірек немесе азырақ тудыратын жағдайлар барлық адамдар үшін бірдей емес. Эндрю мен Брэд орташа есеппен бірдей агрессивті болса да, олар әр контекстте бірдей агрессивтілік танытуы міндетті емес. Бәлкім, Эндрю құрдастарына агрессивті, бірақ басшыларына жуас шығар, ал Брэдтің агрессивтілік деңгейі иерархиялық деңгейге сезімтал емес болар. Бәлкім, Брэд сыналғанда агрессияға бейім, ал физикалық қауіп төнгенде ерекше ұстамды шығар.
Жағдайларға берілетін бұл қолтаңбалық (signature) үлгілер уақыт өте келе айтарлықтай тұрақты болуы мүмкін. Олар біз біреудің тұлғасы деп санайтын нәрсенің негізін құрайды, бірақ оларды жалпы қасиетпен сипаттау мүмкін емес. Эндрю мен Брэд агрессия тестінде бірдей ұпай жинауы мүмкін, бірақ олар агрессия тудырушы факторлар мен контексттерге реакция беру үлгісінде бірегей. Бірдей қасиет деңгейіне ие екі адамды (мысалы, олар бірдей қырсық немесе бірдей жомарт болса) орташа деңгейі бірдей, бірақ әртүрлі жағдайларға реакция беру үлгісі міндетті түрде бірдей емес іс-әрекеттердің екі таралымы ретінде сипаттау керек.
Енді сіз тұлға туралы бұл талқылау мен біз ұсынған төрелік моделі арасындағы параллельді көре аласыз. Төрешілер арасындағы деңгейлік айырмашылықтар тұлғалық қасиеттер бойынша ұпайлар арасындағы айырмашылықтарға сәйкес келеді, олар көптеген жағдайлардағы мінез-құлықтың орташа мәнін білдіреді. Істер — жағдайлардың аналогы. Адамның нақты мәселе бойынша төрелігі оның орташа деңгейіне қарағанда орташа деңгейде ғана болжанады, дәл сол сияқты нақты іс-әрекеттер тұлғалық қасиеттерге қарағанда орташа деңгейде ғана болжанады. Жеке тұлғалардың төрелік бойынша рейтингі бір істен екінші іске айтарлықтай өзгереді, өйткені адамдар әр істе кездесетін сипаттар мен олардың комбинацияларына реакция беруімен ерекшеленеді. Төрелік пен шешім қабылдайтын жеке тұлғаның «қолтаңбасы» — бұл сипаттарға сезімталдықтың бірегей үлгісі және істерді бағалаудағы соған сәйкес бірегей үлгі.
Тұлғаның бірегейлігі әдетте қуануға тұрарлық себеп, бірақ бұл кітап кәсіби төреліктерге арналған, мұндағы ауытқушылық — проблема, ал шу — қателік. Бұл аналогияның мәні — төреліктегі қалыпты шу кездейсоқ емес, тіпті оны түсіндіруге үмітіміз аз болса да және ерекше төрелік жасайтын адамдардың өздері де оны түсіндіріп бере алмаса да.
«Сіз өз қорытындыңызға сенімді сияқтысыз, бірақ бұл оңай мәселе емес: әртүрлі бағыттарды нұсқайтын белгілер бар. Сіз дәлелдемелердің баламалы интерпретацияларын ескермей қалған жоқсыз ба? »
«Сен екеуміз бір үміткермен сұхбаттастық және әдетте біз бірдей талап қоятын сұхбат алушымыз. Дегенмен, біздің төреліктеріміз мүлдем басқаша. Бұл қалыпты шу қайдан пайда болды? »
«Адам тұлғасының бірегейлігі оларды инновациялар мен шығармашылыққа қабілетті етеді, сондай-ақ олармен араласуды қызықты әрі әсерлі етеді. Алайда, төрелікке келгенде, бұл бірегейлік актив болып табылмайды».
17-ТАРАУ Шудың көздері
Осы уақытқа дейін сіз төрелік бар жерде шу бар екеніне келістіңіз деп үміттенеміз. Сондай-ақ, сіз үшін ол бұрын ойлағаннан да көп емес деп сенеміз. Шу туралы бұл мантра біз жобамызды бастаған кезде жігерлендірді, бірақ бұл тақырып бойынша ойымыз онымен жұмыс істеген жылдар ішінде дамыды. Енді біз шудың құрамдас бөліктері, олардың шудың жалпы көрінісіндегі тиісті маңыздылығы және төрелікті зерттеудегі шудың орны туралы алған негізгі сабақтарымызды қарастырамыз.
Шудың құрамдас бөліктері
16-сурет біз 5, 6 және 16-тарауларда енгізген үш теңдеудің біріктірілген графикалық көрінісін ұсынады. Сурет қателіктің үш дәйекті бөлінуін сипаттайды:
қателіктің бейімділікке (bias) және жүйелік шуға бөлінуі, жүйелік шудың деңгейлік шуға және қалыпты шуға бөлінуі, қалыпты шудың тұрақты қалыпты шуға және сәттік шуға бөлінуі.
Енді сіз MSE-нің (Орташа квадраттық қате) бейімділік пен біз талқылаған шудың үш компонентінің квадраттарына қалай бөлінетінін көре аласыз.

16-СУРЕТ: Қателік, бейімділік және шудың компоненттері
Зерттеуімізді бастағанда, біз жалпы қателіктегі бейімділік пен шудың салыстырмалы салмағына назар аудардық. Көп ұзамай шу жиі қателіктің бейімділіктен гөрі үлкенірек компоненті болып табылатынын және оны егжей-тегжейлі зерттеуге тұрарлық екенін түсіндік.
Шудың құрамдас бөліктері туралы ерте кездегі ойларымыз күрделі шу аудиттерінің құрылымына негізделді, мұнда бірнеше адам бірнеше істер бойынша жеке төрелік жасайды. Федералдық судьяларды зерттеу осыған мысал болды, ал айыппұлдық шығындарды (punitive damages) зерттеу — тағы біреуі. Бұл зерттеулердің деректері деңгейлік шудың нақты бағаларын берді. Екінші жағынан, әрбір қатысушы әрбір істі бағалайды, бірақ мұны тек бір рет жасайтындықтан, біз қалыпты қателік деп атаған қалдық қателіктің уақытша немесе тұрақты екенін білу мүмкін емес. Статистикалық талдаудың консервативті рухында қалдық қателік әдетте «қателік мүшесі» деп аталады және кездейсоқ ретінде қарастырылады. Басқаша айтқанда, қалыпты шудың әдепкі интерпретациясы оның толығымен сәттік шудан тұратыны болып табылады.
Қалыпты шуды кездейсоқ қателік ретінде қабылдайтын бұл дәстүрлі интерпретация ұзақ уақыт бойы біздің ойлауымызды шектеп келді. Деңгейлік шуға — қатал және жұмсақ судьялар немесе оптимистік және пессимистік болжаушылар арасындағы тұрақты айырмашылықтарға назар аудару табиғи болып көрінді. Сондай-ақ, бізді сәттік шуды тудыратын қатысы жоқ және өтпелі жағдайлардың төреліктерге әсер етуінің дәлелдері қызықтырды.
Дәлелдер бізді бірте-бірте әртүрлі адамдар жасайтын шулы төреліктер не адамның жалпы бейімділігімен, не өтпелі және кездейсоқ нәрсемен емес, керісінше, нақты адамдардың көптеген сипаттарға тұрақты жеке реакцияларымен анықталатынын түсінуге итермеледі. Бұл олардың нақты істерге беретін реакцияларын анықтайды. Соңында біз қалыпты шудың өтпелі сипаты туралы әдепкі болжамымыздан бас тарту керек деген қорытындыға келдік.
Шектеулі мысалдар жиынтығынан тым жалпылама қорытынды жасамауға тырысқанымызбен, біз жинақтаған зерттеулер тұрақты қалыпты шудың шын мәнінде жүйелік шудың басқа компоненттеріне қарағанда маңыздырақ екенін көрсетеді. Бір зерттеуде қателік компоненттерінің толық көрінісі сирек болатындықтан, бұл алдын ала қорытындыны тұжырымдау үшін триангуляция (бірнеше дереккөзді салыстыру арқылы тексеру әдісі) қажет. Қысқаша айтқанда, біздің білетініміз және білмейтініміз мынау.
Компоненттерді бағалау
Біріншіден, бізде деңгейлік шу мен қалыпты шудың салыстырмалы салмағы туралы бірнеше бағалау бар. Жалпы алғанда, қалыпты шу деңгейлік шуға қарағанда көбірек үлес қосатыны байқалады. Мысалы, 2-тараудағы сақтандыру компаниясында андеррайтерлер белгілеген орташа сыйлықақылар арасындағы айырмашылықтар жалпы жүйелік шудың тек 20%-ын құрады; қалған 80%-ы қалыпты шу болды. 6-тараудағы федералдық судьялар арасында деңгейлік шу (орташа қаталдықтағы айырмашылықтар) жалпы жүйелік шудың жартысынан сәл азын құрады; қалыпты шу үлкенірек компонент болды. Айыппұлдық шығындар экспериментінде жүйелік шудың жалпы мөлшері қолданылатын шкалаға байланысты айтарлықтай өзгерді, бірақ қалыпты шудың үлесі тұрақты болды: ол зерттеуде қолданылған үш шкала үшін жалпы жүйелік шудың тиісінше 63%, 62% және 61%-ын құрады. Біз 5-бөлімде қарастыратын басқа зерттеулер, атап айтқанда кадрлық шешімдер туралы зерттеулер, осы алдын ала қорытындымен сәйкес келеді.
Бұл зерттеулерде деңгейлік шудың әдетте жүйелік шудың үлкен компоненті болмауы — маңызды хабар, өйткені деңгейлік шу — ұйымдар шу аудиттерін жүргізбей-ақ (кейде) бақылай алатын шудың жалғыз түрі. Істер жеке мамандарға азды-көпті кездейсоқ тағайындалғанда, олардың шешімдерінің орташа деңгейіндегі айырмашылықтар деңгейлік шудың дәлелі болып табылады. Мысалы, патенттік кеңселерді зерттеу сарапшылардың патент берудегі орташа бейімділігінде үлкен айырмашылықтар бар екенін байқады, бұл кейіннен осы патенттерге қатысты сот істерінің көбеюіне әсер етті. Сол сияқты, балаларды қорғау қызметіндегі іс жүргізушілердің балаларды асыраушы отбасыларға орналастыруға бейімділігі әртүрлі болады, бұл балалардың әл-ауқатына ұзақ мерзімді әсер етеді. Бұл бақылаулар тек деңгейлік шуды бағалауға негізделген. Егер деңгейлік шудан гөрі қалыпты шу көбірек болса, онда бұл онсыз да таңқаларлық нәтижелер шу мәселесінің ауқымын кем дегенде екі есе азайтып көрсетеді. (Бұл алдын ала ережеден ерекшеліктер бар. Баспана беру туралы судьялардың шешімдеріндегі масқара ауытқушылық, сірә, қалыпты шуға қарағанда деңгейлік шуға көбірек байланысты, дегенмен біз қалыпты шу да үлкен деп күтеміз. )
Келесі қадам — қалыпты шуды оның екі компонентін бөлу арқылы талдау. Сәттік шуға қарағанда тұрақты қалыпты шу басым компонент деп айтуға негізді себептер бар. Федералдық судьялардың үкімдеріне жүргізілген аудит біздің логикамызды сипаттайды. Барлық қалыпты шу уақытша деген экстремалды мүмкіндіктен бастайық. Ондай жағдайда үкім шығару уақыт өте келе тұрақсыз және қайшылықты болар еді, бұл бізге сенімсіз болып көрінеді: біз бір судьяның бір іс бойынша әртүрлі уақытта шығарған төреліктерінің арасындағы орташа айырмашылық шамамен 2. 8 жыл болады деп күтуіміз керек еді. Судьялар арасындағы орташа үкімдердің ауытқуы онсыз да таңқаларлық. Жеке судьяның үкімдеріндегі осындай ауытқушылық тіпті қисынсыз болар еді. Судьялардың әртүрлі сотталушылар мен әртүрлі қылмыстарға беретін реакциялары әртүрлі және бұл айырмашылықтар өте жеке сипатта болғанымен, тұрақты деген қорытынды жасау қисындырақ көрінеді.
Қалыпты шудың қаншалықты бөлігі тұрақты, ал қаншалықты бөлігі сәттік шу екенін нақтылау үшін бізге бір судья әрбір іс бойынша екі тәуелсіз бағалау жасайтын зерттеулер қажет. Біз атап өткендей, төрелікті зерттеуде екі тәуелсіз төрелік алу әдетте мүмкін емес, өйткені іс бойынша екінші төреліктің біріншіден шынымен тәуелсіз болуына кепілдік беру қиын. Әсіресе төрелік күрделі болғанда, адамның мәселені танып, бастапқы төрелікті қайталау ықтималдығы жоғары болады.
Принстондағы Александр Тодоров бастаған зерттеушілер тобы бұл мәселені шешу үшін тапқыр эксперименттік әдістер жасап шығарды. Олар Amazon Mechanical Turk сайтынан қатысушыларды жинады. Бір экспериментте қатысушылар бет-әлпет суреттерін (компьютерлік бағдарлама арқылы жасалған, бірақ нағыз адамдардың жүзінен айнымайтын) көрді және оларды жағымдылық пен сенімділік сияқты әртүрлі атрибуттар бойынша бағалады. Эксперимент бір аптадан кейін дәл сол беттермен және дәл сол респонденттермен қайталанды.
Бұл экспериментте сот үкімін шығаратын судьялар сияқты кәсіби төреліктерге қарағанда консенсус аз болады деп күту орынды. Кейбір адамдардың өте тартымды, ал басқаларының өте тартымды емес екеніне бәрі келісуі мүмкін, бірақ айтарлықтай диапазон арасында бет-әлпетке берілетін реакциялар негізінен идиосинкразиялық болады деп күтеміз. Шынында да, бақылаушылар арасында келісім аз болды: мысалы, сенімділікті бағалауда суреттер арасындағы айырмашылықтар төреліктер дисперсиясының (ауытқуының) тек 18%-ын құрады. Қалған 82% дисперсия шу болды.
Сондай-ақ, бұл төреліктерде тұрақтылық аз болады деп күту де орынды, өйткені онлайн сұрақтарға жауап беру үшін ақы төленетін қатысушылардың төрелік сапасы кәсіби ортаға қарағанда жиі төмен болады. Соған қарамастан, шудың ең үлкен компоненті тұрақты қалыпты шу болды. Шудың екінші үлкен компоненті деңгейлік шу болды, яғни бақылаушылардың сенімділікті бағалаудағы орташа көрсеткіштерінің айырмашылығы. Сәттік шу, әлі де қомақты болса да, ең кіші компонент болды.
Зерттеушілер қатысушылардан басқа төреліктер жасауды сұрағанда да (мысалы, автомобильдер немесе тағамдар арасындағы таңдау немесе кәсіби төреліктерге жақын сұрақтар бойынша) осындай қорытындыларға келді. Мысалы, 15-тарауда талқыланған айыппұлдық шығындарды зерттеуді қайталау кезінде қатысушылар бір апта аралықпен екі бөлек жағдайда жеке жарақат алудың он жағдайы бойынша өздерінің айыппұл салу ниетін бағалады. Мұнда да тұрақты қалыпты шу ең үлкен компонент болды. Барлық осы зерттеулерде адамдар жалпы алғанда бір-бірімен келіспеді, бірақ олар өз төреліктерінде айтарлықтай тұрақты болды. Бұл «консенсуссыз жүйелілік» (consistency without consensus), зерттеушілердің сөзімен айтқанда, тұрақты қалыпты шудың айқын дәлелі болып табылады.
Тұрақты үлгілердің рөлі туралы ең күшті дәлел 10-тарауда аталған кепілмен босату туралы судьялардың ауқымды зерттеуінен алынған. Осы ерекше зерттеудің бір бөлігінде авторлар әрбір судьяның кепілдік беру туралы шешім қабылдауда қолда бар белгілерді қалай пайдаланғанын имитациялайтын статистикалық модель жасады. Олар 173 судьяның жеке модельдерін құрастырды. Содан кейін осы симуляцияланған судьяларды 141 833 іс бойынша шешім қабылдауға қолданып, әр іс үшін 173 шешім — жалпы алғанда 24 миллионнан астам шешім алды. Біздің өтінішіміз бойынша, авторлар бағалау дисперсиясын үш құрамдасқа бөлген арнайы талдау жүргізді: әрбір іс бойынша орташа шешімдердің «шынайы» дисперсиясы, судьялардың кепілдік беруге бейімділігіндегі айырмашылықтардан туындаған деңгейлік шу (түрлі бағалаушылардың орташа көрсеткіштері арасындағы ауытқу) және қалған үлгілік шу.
Бұл талдау біздің дәлелімізге өте маңызды, себебі бұл зерттеуде өлшенген үлгілік шу толығымен тұрақты. Мұнда жағдайлық шудың (бір адамның шешіміндегі уақытқа байланысты кездейсоқ ауытқулар) кездейсоқ құбылмалылығы көрсетілмеген, өйткені бұл судьяның шешімін болжайтын модельдерді талдау болып табылады. Тек тексерілетін тұрақты жеке болжау ережелері ғана қосылған.
Қорытынды бірмағыналы болды: бұл тұрақты үлгілік шу деңгейлік шудан төрт есеге жуық үлкен болды (тұрақты үлгілік шу жалпы дисперсияның 26%-ын, ал деңгейлік шу 7%-ын құрады). Анықталған тұрақты, ерекше жеке бағалау үлгілері жалпы қатаңдық деңгейіндегі айырмашылықтардан әлдеқайда жоғары болды.
Бұл дәлелдердің барлығы 7-тарауда қарастырылған жағдайлық шу туралы зерттеулермен сәйкес келеді: жағдайлық шудың болуы таңғаларлық және тіпті мазасыз болғанымен, адам ішіндегі құбылмалылық адамдар арасындағы айырмашылықтардан үлкен екендігі туралы ешқандай белгі жоқ. Жүйелік шудың ең маңызды құрамдас бөлігі — біз бастапқыда ескермеген тұрақты үлгілік шу (сарапшылардың нақты жағдайларды бағалауындағы өзіндік ерекшеліктері), яғни судьялардың нақты істерді бағалауындағы құбылмалылығы.
Тиісті зерттеулердің салыстырмалы түрде аздығын ескерсек, біздің қорытындыларымыз болжамды сипатта, бірақ олар шу туралы және онымен қалай күресу керектігі туралы ойымыздың өзгергенін көрсетеді. Принципті түрде алғанда, деңгейлік шуды — немесе судьялар арасындағы қарапайым, жалпы айырмашылықтарды — өлшеу және шешу салыстырмалы түрде оңай мәселе болуы керек. Егер шектен тыс «қатал» баға қоюшылар, «сақ» бала қамқоршылары немесе «тәуекелден қашатын» несие мамандары болса, оларды жұмысқа алған ұйымдар олардың бағалауларының орташа деңгейін теңестіруге тырысуы мүмкін. Мысалы, университеттер бұл мәселені профессорлардан әр сыныпта алдын ала белгіленген баға үлестірімін сақтауды талап ету арқылы шешеді.
Өкінішке қарай, біз енді түсінгеніміздей, тек деңгейлік шуға назар аудару жеке айырмашылықтардың үлкен бөлігін назардан тыс қалдырады. Шу көбінесе деңгей айырмашылықтарынан емес, өзара әрекеттесулерден туындайды: әртүрлі судьялардың нақты айыпталушылармен қалай жұмыс істейтіні, әртүрлі мұғалімдердің нақты оқушылармен қалай қарым-қатынас жасайтыны, әртүрлі әлеуметтік қызметкерлердің нақты отбасыларға қалай қарайтыны, әртүрлі көшбасшылардың болашақтың нақты бейнелеріне қалай қарайтыны. Шу — бұл көбінесе біздің бірегейлігіміздің, біздің «бағалау тұлғамыздың» жанама өнімі. Деңгейлік шуды азайту әлі де маңызды мақсат, бірақ тек осы мақсатқа қол жеткізу жүйелік шу мәселесінің көп бөлігін шешімсіз қалдырады.
Қатені түсіндіру
Біз шу туралы айтарлықтай көп нәрсе таптық, бірақ бұл тақырып қоғамдық санада және бағалау мен қателіктер туралы талқылауларда мүлдем жоқ. Оның бар екендігінің дәлелдеріне және оны тудыратын көптеген механизмдерге қарамастан, шу бағалаудағы негізгі фактор ретінде сирек аталады. Бұл қалай мүмкін? Неліктен біз қате бағалауларды түсіндіру үшін шуды ешқашан алға тартпаймыз, ал біржақтылықты (bias) үнемі кінәлаймыз? Неліктен шу барлық жерде кездесетініне қарамастан, оны қателік көзі ретінде қарастыру соншалықты сирек кездеседі?
Бұл жұмбақтың кілті мынада: қателіктердің орташа мәні (біржақтылық) және қателіктердің құбылмалылығы (шу) қателік теңдеуінде тең рөл атқарғанымен, біз олар туралы мүлдем басқаша ойлаймыз. Біздің айналамыздағы әлемді түсінудің әдеттегі тәсілі шудың рөлін тануды мүмкін етпейді.
Осы кітаптың басында біз оқиғалар болғаннан кейін оларды оңай түсіндіретінімізді, бірақ олар болғанға дейін оларды болжай алмағанымызды айтқан болатынбыз. Қалыптылық аймағында оқиғалар таңғаларлық емес және оңай түсіндіріледі.
Осыны бағалаулар туралы да айтуға болады. Басқа оқиғалар сияқты, бағалаулар мен шешімдер негізінен қалыптылық аймағында болады; олар әдетте бізді таңғалдырмайды. Біріншіден, қанағаттанарлық нәтиже беретін бағалаулар қалыпты жағдай және сирек күмән тудырады. Еркін соққыға таңдалған ойыншы гол соққанда, жүрекке жасалған ота сәтті өткенде немесе стартап гүлденгенде, біз шешім қабылдаушылардың өз таңдауы үшін негіздері дұрыс болған деп есептейміз. Өйткені, олардың дұрыстығы дәлелденді. Кез келген басқа таңғаларлық емес оқиға сияқты, сәттілік тарихы нәтиже белгілі болғаннан кейін өзін-өзі түсіндіреді.
Дегенмен, біз қалыпты емес нәтижелерді түсіндіру қажеттілігін сезінеміз: жаман нәтижелерді және кейде таңғаларлық жақсы нәтижелерді — мысалы, ақталған шок тудыратын бизнес тәуекелін. Қателікке немесе ерекше қабілетке сілтеме жасайтын түсіндірмелер лайықты деңгейден әлдеқайда танымал, өйткені өткендегі маңызды тәуекелдер олардың нәтижесі белгілі болған кезде оңай гениалдылық немесе ақымақтық әрекеттерге айналады. Психологияда жақсы құжатталған негізгі атрибуция қателігі (адамның іс-әрекетін сыртқы жағдайлармен емес, оның жеке қасиеттерімен түсіндіруге бейімділік) деп аталатын біржақтылық — бұл сәтсіздік немесе сәттілік үшін кінәні немесе мақтауды сәттілікпен немесе объективті жағдайлармен түсіндіруге болатын әрекеттер мен нәтижелер үшін агенттерге (адамдарға) жүктеуге деген күшті бейімділік. Тағы бір біржақтылық, өткенді білу инерциясы (оқиға болғаннан кейін оның алдын ала белгілі болғандай көрінуі), бағалауды бұрмалайды, сондықтан болжау мүмкін болмаған нәтижелер өткенге қарағанда оңай болжанатын сияқты көрінеді.
Бағалау қателіктерін түсіндіру қиын емес; бағалаудың себептерін табу, тіпті оқиғалардың себептерін табудан да оңайырақ. Біз әрқашан бағалау жасайтын адамдардың мақсаттарына сілтеме жасай аламыз. Егер бұл жеткіліксіз болса, біз олардың біліксіздігін кінәлай аламыз. Соңғы онжылдықтарда нашар бағалаулардың тағы бір түсіндірмесі кең таралды: психологиялық біржақтылық (bias).
Психология мен мінез-құлық экономикасы саласындағы ауқымды зерттеулер психологиялық біржақтылықтардың ұзақ тізімін құжаттады: жоспарлау қателігі, асқан сенімділік, шығыннан қашу, иелену әсері, статус-кво біржақтылығы, болашақты шектен тыс дисконттау («қазіргі уақытқа біржақтылық») және басқа да көптеген, соның ішінде, әрине, адамдардың әртүрлі санаттарына қатысты біржақтылықтар. Осы біржақтылықтардың әрқайсысы бағалаулар мен шешімдерге қашан әсер етуі мүмкін екендігі туралы көп нәрсе белгілі және бақылаушыға біржақты ойлауды нақты уақыт режимінде тануға мүмкіндік беретін көптеген мәліметтер бар.
Психологиялық біржақтылық бағалау қатесінің заңды себепті түсіндірмесі болып табылады, егер біржақтылықты алдын ала болжау мүмкін болса немесе нақты уақытта анықтау мүмкін болса. Тек фактіден кейін анықталған психологиялық біржақтылық, егер ол болашақ туралы болжам ұсынса, әлі де пайдалы, бірақ болжамды түсіндірме бере алады. Мысалы, лауазымға лайықты әйел үміткердің күтпеген жерден қабылданбауы гендерлік біржақтылықтың жалпы гипотезасын тудыруы мүмкін, оны сол комитеттің болашақтағы тағайындаулары растайды немесе жоққа шығарады. Керісінше, тек бір оқиғаға қатысты себепті түсіндіруді қарастырыңыз: «Бұл жағдайда олар сәтсіздікке ұшырады, демек олар өздеріне тым сенімді болған болуы керек». Бұл мәлімдеме мүлдем мағынасыз, бірақ ол түсіну иллюзиясын береді, бұл өте қанағаттанарлық болуы мүмкін. Бизнес мектебінің профессоры Фил Розенцвейг бизнес нәтижелерін талқылауда біржақтылық тұрғысынан бос түсіндірмелер жиі кездесетінін сенімді түрде дәлелдеді. Олардың танымалдылығы тәжірибені мағыналы ететін себепті оқиғаларға деген жалпы қажеттілікті көрсетеді.
Шу — бұл статистика
12-тарауда атап өткеніміздей, біздің қалыпты ойлау тәсіліміз себепті болып келеді. Біз табиғи түрде нақты нәрселерге назар аударамыз, жеке жағдайлар туралы себепті байланысқан оқиғаларды бақылаймыз және жасаймыз, онда сәтсіздіктер көбінесе қателіктерге, ал қателіктер біржақтылықтарға жатқызылады. Нашар бағалауларды түсіндірудің оңайлығы қателіктер туралы есептерімізде шуға орын қалдырмайды.
Шудың көрінбеуі — себепті ойлаудың тікелей салдары. Шу табиғатынан статистикалық болып табылады: ол біз ұқсас бағалаулар жиынтығы туралы статистикалық тұрғыдан ойлағанда ғана көрінеді. Шынында да, оны байқамау қиын: бұл үкім шығару және сақтандыру сыйлықақылары туралы өткенге негізделген статистикадағы құбылмалылық. Бұл сіз бен басқалар болашақ нәтижені қалай болжау керектігін қарастырған кездегі мүмкіндіктер ауқымы. Бұл нысанадағы соққылардың шашырауы. Себеп-салдар тұрғысынан шу еш жерде жоқ; статистикалық тұрғыдан ол барлық жерде.
Өкінішке қарай, статистикалық көзқарасты қабылдау оңай емес. Біз бақылайтын оқиғалардың себептерін еш қиындықсыз табамыз, бірақ олар туралы статистикалық ойлауды үйрену керек және бұл күш-жігерді талап етеді. Себептер — табиғи нәрсе; статистика — қиын.
Нәтижесінде біз біржақтылық пен шуды қателік көзі ретінде қарастыруда айқын теңсіздік туындайды. Егер сіз психологияға кіріспе курсын оқыған болсаңыз, анық емес фоннан айқын және егжей-тегжейлі фигура ерекшеленіп тұратын суреттерді есіңізде шығар. Фигура фонға қарағанда кішкентай болса да, біздің назарымыз оған нық бекітіледі. Фигура/фон демонстрациялары біздің біржақтылық пен шу туралы интуициямыз үшін қолайлы метафора болып табылады: біржақтылық — бұл назар аударатын фигура, ал шу — біз мән бермейтін фон. Осылайша біз бағалауымыздағы үлкен кемшілікті байқамай қаламыз.
Шу көздері туралы айтатын болсақ: — «Біз бағалаулардың орташа деңгейіндегі айырмашылықтарды оңай көреміз, бірақ біз көрмейтін үлгілік шу қаншалықты үлкен? » — «Сіз бұл бағалау біржақтылықтан болды дейсіз, бірақ нәтиже басқаша болса, сіз солай айтар ма едіңіз? Және шу бар-жоғын айта аласыз ба? » — «Біз біржақтылықты азайтуға дұрыс назар аударып отырмыз. Шуды азайту туралы да ойланайық».
V БӨЛІМ Бағалауды жақсарту
Ұйым өз мамандарының қабылдайтын шешімдерін қалай жақсарта алады? Атап айтқанда, ұйым бағалаудағы шуды қалай азайта алады? Егер сіз осы сұрақтарға жауап беруге жауапты болсаңыз, оны қалай жүзеге асырар едіңіз?
Бірінші қадам — ұйымға кәсіби бағалаудағы шу назар аударуға тұрарлық мәселе екенін мойындату. Осыған жету үшін біз шу аудитін (бір тапсырманы бірнеше адамға бағалату арқылы ауытқуларды анықтау) өткізуді ұсынамыз (толық сипаттаманы А қосымшасынан қараңыз). Шу аудитінде бірнеше адам бірдей мәселелерді бағалайды. Шу — бұл бағалаулардың құбылмалылығы. Бұл құбылмалылық біліксіздікке байланысты болатын жағдайлар болады: кейбір судьялар не туралы айтып жатқанын біледі, басқалары білмейді. Мұндай дағды тапшылығы болған кезде (жалпы немесе белгілі бір жағдайларда), бірінші кезекте жетіспейтін дағдыларды жақсарту керек. Бірақ біз көргеніміздей, тіпті құзыретті және жақсы дайындалған мамандардың бағалауында да үлкен көлемдегі шу болуы мүмкін.
Егер жүйелік шудың көлемі шешуге тұрарлық болса, бағалауды ережелермен немесе алгоритмдермен алмастыру — сіз қарастыруыңыз керек нұсқа, өйткені бұл шуды толығымен жояды. Бірақ ережелердің өз мәселелері бар (біз мұны 6-бөлімде көреміз) және тіпті жасанды интеллектінің ең ынталы жақтаушылары да алгоритмдер адам бағалауын толық алмастыра алмайтынымен келіседі. Бағалауды жақсарту міндеті бұрынғыдан да өзекті және бұл кітаптың осы бөлімінің тақырыбы.
Бағалауды жақсартудың тиімді жолы — ең жақсы адам-сарапшыларды таңдау. Тирде кейбір мергендердің нысананы көздеуі ерекше жақсы болады. Кез келген кәсіби бағалау тапсырмасы үшін де солай: ең жоғары білікті адамдарда шу да, біржақтылық та аз болады. Ең жақсы сарапшыларды қалай табуға болатыны кейде анық көрінеді; егер сіз шахмат есебін шешкіңіз келсе, бұл кітаптың авторларынан емес, гроссмейстерден сұраңыз. Бірақ көптеген мәселелерде жақсы сарапшылардың сипаттамаларын ажырату қиынырақ. Бұл сипаттамалар 18-тараудың тақырыбы болады.
Әрі қарай біз бағалау қателіктерін азайту тәсілдерін талқылаймыз. Психологиялық біржақтылықтар статистикалық біржақтылыққа да, шуға да қатысты. 19-тарауда көретініміздей, психологиялық біржақтылықтарға қарсы тұрудың көптеген әрекеттері болды, олардың кейбіреулері сәтсіз, ал кейбіреулері сәтті болды. Біз біржақтылықты жою стратегияларын қысқаша қарастырамыз және біздің білуімізше, жүйелі түрде зерттелмеген перспективалы тәсілді ұсынамыз: топтың жұмысына бір немесе бірнеше таныс біржақтылықтар әсер етіп жатқанын нақты уақыт режимінде көрсете алатын диагностикалық белгілерді іздеу үшін арнайы тағайындалған шешім бақылаушысын пайдалану. В қосымшасында шешім бақылаушысы қолдана алатын біржақтылықтарды тексеру парағының мысалы берілген.
Содан кейін біз осы бөлімдегі негізгі назарымызға көшеміз: шумен күрес. Біз шешім гигиенасы (қателіктерді олардың түрін нақты білместен алдын алуға бағытталған шаралар) тақырыбын енгіземіз, бұл адам бағалауындағы шуды азайту үшін ұсынатын әдісіміз. Біз бес түрлі саладағы жағдайларды қарастырамыз. Әр салада біз шудың таралуын және ол тудыратын кейбір қорқынышты оқиғаларды зерттейміз. Сондай-ақ, шуды азайту бойынша күш-жігердің сәттілігін немесе сәтсіздігін қарастырамыз. Әр салада, әрине, бірнеше тәсілдер қолданылды, бірақ баяндауды жеңілдету үшін әр тарауда бір шешім гигиенасы стратегиясына басымдық беріледі.
20-тарауда сот сараптамасы жағдайынан бастаймыз, ол ақпаратты ретке келтірудің (мәліметтерді белгілі бір кезекпен беру) маңыздылығын көрсетеді. Жүйелілікке ұмтылу адамдарды қолда бар шектеулі дәлелдер негізінде ерте әсер қалыптастыруға, содан кейін өздерінің пайда болған алдын ала пайымдауларын растауға итермелейді. Сондықтан бағалау процесінің басында қатысы жоқ ақпаратқа тап болмау маңызды. 21-тарауда біз болжау жағдайына көшеміз, ол шуды азайтудың ең маңызды стратегияларының бірі: бірнеше тәуелсіз бағалауларды біріктірудің құндылығын көрсетеді. «Көпшіліктің даналығы» принципі бірнеше тәуелсіз бағалауларды орташаландыруға негізделген, бұл шуды азайтуға кепілдік береді. Тікелей орташаландырудан басқа, бағалауларды біріктірудің басқа әдістері де бар, олар болжау мысалында көрсетілген. 22-тарау медицинадағы шуды және оны азайту бойынша күш-жігерді қарастырады. Ол қылмыстық үкім шығару мысалында біз енгізген шуды азайту стратегиясының маңыздылығы мен жалпы қолданылуын көрсетеді: бағалау нұсқаулықтары (шешім қабылдауға көмектесетін ережелер жиынтығы). Нұсқаулықтар шуды азайтудың қуатты механизмі болуы мүмкін, өйткені олар түпкілікті шешімдердегі судьялар арасындағы құбылмалылықты тікелей азайтады. 23-тарауда біз іскерлік өмірдегі таныс мәселеге көшеміз: жұмыс нәтижелілігін бағалау. Ондағы шуды азайту әрекеттері сыртқы көзқарасқа негізделген ортақ шкаланы пайдаланудың маңыздылығын көрсетеді. Бұл қарапайым себеппен маңызды шешім гигиенасы стратегиясы болып табылады: бағалау әсерді шкалаға көшіруді білдіреді және егер әртүрлі бағалаушылар әртүрлі шкалаларды қолданса, шу пайда болады. 24-тарау персоналды таңдау тақырыбын зерттейді. Ол маңызды шешім гигиенасы стратегиясының құндылығын көрсетеді: күрделі бағалауларды құрылымдау. Құрылымдау дегеніміз — бағалауды оның құрамдас бөліктеріне бөлу, мәліметтерді жинау процесін басқару (енгізілетін деректердің бір-бірінен тәуелсіздігін қамтамасыз ету) және барлық мәліметтер жиналғанша қорытынды шешімді кейінге қалдыру.
25-тарауда біз персоналды таңдау саласынан алынған сабақтарға сүйене отырып, опцияларды бағалаудың жалпы тәсілін ұсынамыз, ол аралық бағалау хаттамасы немесе қысқаша MAP (Mediating Assessments Protocol) деп аталады. MAP «опциялар — үміткерлер сияқты» деген қағидадан басталады және құрылымдалған шешім қабылдаудың, сондай-ақ жоғарыда аталған басқа шешім гигиенасы стратегияларының қайталанатын және бірегей шешімдер үшін қалай енгізілетінін сипаттайды.
Жалпы ескерту: әртүрлі контексттердегі әрбір шешім гигиенасы стратегиясының ықтимал пайдасын нақтылау, тіпті сандық түрде көрсету құнды болар еді. Сондай-ақ, қай стратегияның ең пайдалы екенін білу және оларды қалай салыстыру керектігін түсіну маңызды болар еді. Ақпарат ағыны бақыланған кезде шу қаншалықты азаяды? Іс жүзінде қанша бағалауды біріктіру керек? Құрылымдау құнды болуы мүмкін, бірақ әртүрлі контексттерде ол қаншалықты құнды? Бұл сұрақтар әлі де ашық қалып отыр, зерттеулер ақыр соңында оларға жауап бере алады. Практикалық мақсаттар үшін стратегияның пайдасы ол қолданылатын нақты жағдайға байланысты болады.
18-ТАРАУ Жақсырақ бағалау үшін жақсырақ судьялар
Осы уақытқа дейін біз адам-судьялар туралы олардың арасындағы айырмашылықты көрсетпей айтып келдік. Дегенмен, бағалауды талап ететін кез келген тапсырмада кейбір адамдар басқаларға қарағанда жақсы нәтиже көрсететіні анық. Тіпті «көпшілік даналығы» негізіндегі бағалаулар жиынтығы да, егер бұл көпшілік қабілетті адамдардан құралса, жақсырақ болады. Олай болса, маңызды сұрақ — осы жақсырақ судьяларды қалай анықтауға болады?
Үш нәрсе маңызды. Бағалауды жасайтындар жақсы дайындалған, зияткерлігі жоғары және дұрыс когнитивтік стильге ие болған кезде, бағалауда шу да, біржақтылық та аз болады. Басқаша айтқанда: жақсы бағалау сіздің не білетініңізге, қалай жақсы ойлайтыныңызға және қалай ойлайтыныңызға байланысты. Жақсы судьялар тәжірибелі және ақылды болып келеді, сонымен қатар олар белсенді түрде ашық ойлы және жаңа ақпараттан үйренуге дайын болады.
Сарапшылар және құрмет-сарапшылар
Судьялардың шеберлігі олардың бағалау сапасына әсер етеді деу — бұл аксиома. Мысалы, білікті рентгенологтар пневмонияны дұрыс анықтауға көбірек бейім, ал әлемдік оқиғаларды болжауда өздерінің әріптестерінен озып түсетін «суперболжаушылар» бар. Егер сіз құқықтың белгілі бір саласында нағыз маман болып табылатын адвокаттар тобын жинасаңыз, олар соттағы қарапайым құқықтық даулардың нәтижесі туралы ұқсас және дұрыс болжамдар жасауы мүмкін. Жоғары білікті адамдар аз шу шығарады, сонымен қатар олар аз біржақтылық танытады.
Бұл адамдар қарастырылып отырған тапсырмалар бойынша нағыз сарапшылар. Олардың басқалардан артықшылығы нәтижелер туралы мәліметтердің арқасында тексеріледі. Принципті түрде алғанда, біз дәрігерді, болжаушыны немесе адвокатты олардың өткенде қаншалықты жиі дұрыс болғанына қарай таңдай аламыз. (Түсінікті себептермен бұл тәсіл тәжірибеде қиын болуы мүмкін; біз отбасылық дәрігеріңізді біліктілік емтиханынан өткізуге тырысуды ұсынбаймыз).
Көптеген бағалауларды тексеру мүмкін емес. Белгілі бір шеңберде біз бағалаулар бағытталған шынайы құндылықты оңай біле алмаймыз немесе даусыз анықтай алмаймыз. Сақтандыру және қылмыстық үкім шығару осы санатқа жатады, сондай-ақ шарап дәмін тату, эссе бағалау, кітап пен фильмге шолу жасау және басқа да сансыз бағалаулар. Соған қарамастан, осы салалардағы кейбір мамандар сарапшы деп аталады. Осы сарапшылардың бағалауына деген сеніміміз толығымен олардың әріптестері тарапынан ие болған құрметіне негізделген. Біз оларды құрмет-сарапшылар (нәтижесін нақты тексеру мүмкін емес, бірақ беделі жоғары маман) деп атаймыз.
«Құрмет-сарапшы» термині құрметсіздік танытуды білдірмейді. Кейбір сарапшылардың бағалау дәлдігін бағалауға жатпайтыны — бұл сын емес; бұл көптеген салалардағы өмір шындығы. Көптеген профессорлар, ғалымдар және менеджмент жөніндегі кеңесшілер — құрмет-сарапшылар. Олардың сенімділігі студенттерінің, әріптестерінің немесе клиенттерінің құрметіне байланысты. Осы салалардың барлығында бір маманның бағалауын тек оның әріптестерінің бағалауымен ғана салыстыруға болады.
Кімнің дұрыс не бұрыс екенін анықтайтын шынайы құндылықтар болмаған жағдайда, біз мәртебелі сарапшылардың (нақты деректермен емес, қоғамдағы беделі мен кәсіби мәртебесімен танылған мамандар) пікірін, тіпті олар бір-бірімен келіспесе де, жоғары бағалаймыз. Мысалы, дипломатиялық дағдарыстың себептері мен оның қалай өрбитіні туралы бір-біріне мүлдем қарама-қайшы пікір айтып отырған саяси сарапшылар тобын елестетіп көріңізші. (Мұндай келіспеушілік — қалыпты жағдай; егер бәрі бірауыздан келіссе, талқылау қызық болмас еді). Сарапшылардың әрқайсысы мәселенің жалғыз дұрыс шешімі бар екеніне және өз көзқарасы соған ең жақын екеніне сенімді. Тыңдап отырып, сіз бірнеше сарапшының біліктілігіне тәнті болып, олардың уәждерін бірдей сенімді деп табуыңыз мүмкін. Ол сәтте кімнің сөзі шындыққа жанасатынын біле алмайсыз (тіпті кейінірек, егер олардың талдаулары нақты тексерілетін болжамдар түрінде жасалмаса, тағы білмей қалуыңыз мүмкін). Сарапшылар арасында келіспеушілік болғандықтан, кем дегенде кейбіреулерінің қателесіп тұрғанын түсінесіз. Соған қарамастан, сіз олардың кәсіби шеберлігін құрметтейсіз.
Немесе мүлдем болжам жасамайтын басқа сарапшылар тобын алайық. Бір бөлмеде жақсы дайындалған үш моралдық философ жиналған делік. Бірі — Иммануил Канттың, екіншісі — Джереми Бентамның, үшіншісі Аристотельдің ілімін ұстанады. Моральдық талаптарға келгенде олардың пікірлері түбегейлі алшақ. Мәселе өтірік айтудың қай кезде орынды екені, жануарлардың құқығы немесе қылмыстық жазаның мақсаты туралы болуы мүмкін. Сіз мұқият тыңдайсыз. Олардың ойлау жүйесінің анықтығы мен дәлдігіне таңғалуыңыз мүмкін. Сіз бір философтың пікіріне бейім болсаңыз да, олардың барлығын құрметтейсіз.
Неліктен бұлай істейсіз? Жалпы алғанда, біліктілігін объективті түрде дәлелдейтін деректер болмаса да, шешімдерінің сапасымен құрметке ие болған адамдар біреуге сарапшы ретінде сенуді қалай шешеді? Мәртебелі сарапшыны не ерекшелейді?
Жауаптың бір бөлігі — ортақ нормалардың немесе кәсіби доктринаның болуында. Сарапшылар көбінесе кәсіби қоғамдастықтардан біліктілік алып, өз ұйымдарында оқу мен қадағалаудан өтеді. Резидентураны бітірген дәрігерлер немесе аға серіктесінен тәжірибе жинаған жас заңгерлер тек техникалық құралдарды меңгеріп қана қоймайды; олар белгілі бір әдістерді қолдануға және нақты нормаларды сақтауға дағдыланады.
Ортақ нормалар мамандарға қандай мәліметтерді ескеру керектігін және қорытынды шешімді қалай қабылдап, негіздеу қажеттігін түсінуге мүмкіндік береді. Мысалы, сақтандыру компаниясындағы шығындарды бағалаушылар шағымды бағалау үшін бақылау тізіміне қандай мәселелерді енгізу керектігін оңай келісіп, сипаттай алды.
Әрине, бұл келісім бағалаушылардың шағымдарды әртүрлі бағалауына кедергі болған жоқ, өйткені доктрина жұмыс барысын егжей-тегжейлі көрсетпейді. Бұл механикалық түрде орындалатын рецепт емес. Керісінше, доктрина интерпретациялауға (түсіндіруге) орын қалдырады. Сарапшылар есептеулер емес, пайымдаулар жасайды. Сондықтан шу (бірдей жағдайдағы шешімдердің кездейсоқ алшақтығы) міндетті түрде пайда болады. Тіпті бірдей оқытылған және ортақ доктринаны ұстанатын мамандардың өзі оны іс жүзінде қолдану кезінде бір-бірінен алшақтай бастайды.
Ортақ нормаларды білумен қатар, тәжірибе де қажет. Егер сіздің салаңыз шахмат, концерттік пианино немесе найза лақтыру болса, сіз жас дарын болуыңыз мүмкін, өйткені нәтижелер сіздің деңгейіңізді бірден растайды. Бірақ андеррайтерлер (тәуекелді бағалаушылар), саусақ ізін тексерушілер немесе судьялар сенімділікке ие болу үшін әдетте бірнеше жылдық тәжірибені қажет етеді. Андеррайтинг саласында «жас дарындар» болмайды.
Мәртебелі сарапшылардың тағы бір сипаты — өз пайымдауларын нық сеніммен жасау және түсіндіру қабілеті. Біз күмәнданатын адамдарға қарағанда, өзіне сенімді жандарға көбірек сенім артуға бейімбіз. Сенімділік эвристикасы (адамның нық сөйлеуін біліктілік деп қабылдау) топ ішінде өзіне сенімді адамдардың, тіпті оған негіз болмаса да, басқаларға қарағанда салмағы басым болатынын көрсетеді. Мәртебелі сарапшылар қисынды оқиғалар құрастыруға шебер. Тәжірибелері оларға заңдылықтарды тануға, алдыңғы жағдайлармен ұқсастықтар табуға және гипотезаларды тез құрып, растауға мүмкіндік береді. Олар көрген деректерін сенім ұялататын жүйелі оқиғаға оңай айналдырады.
Интеллект
Дайындық, тәжірибе және сенімділік мәртебелі сарапшыларға сенім туғызуға көмектеседі. Бірақ бұл қасиеттер олардың пайымдауларының сапасына кепілдік бермейді. Қай сарапшының жақсы шешім қабылдау ықтималдығы жоғары екенін қалай білеміз?
Жалпы интеллекттің жақсы пайымдау жасаумен байланысты екеніне сенуге толық негіз бар. Интеллект барлық дерлік салалардағы жақсы нәтижелермен тығыз байланысты. Барлық басқа жағдайлар тең болғанда, ол тек жоғары академиялық жетістіктерге ғана емес, сонымен бірге жоғары жұмыс өнімділігіне де әсер етеді.
Интеллектті немесе GMA-ны (Жалпы ақыл-ой қабілеті — интеллект коэффициенті немесе IQ-дың орнына қолданылатын термин) өлшеуге қатысты көптеген пікірталастар мен түсінбеушіліктер туындайды. Интеллекттің туа біткен табиғаты туралы қате түсініктер әлі де бар; іс жүзінде тесттер дамыған қабілеттерді өлшейді, олар ішінара тұқым қуалайтын қасиеттерге, ішінара қоршаған ортаға, соның ішінде білім алу мүмкіндіктеріне байланысты. Көптеген адамдар GMA-ға негізделген іріктеудің белгілі бір әлеуметтік топтарға тигізетін кері әсеріне және мұндай тесттерді жұмысқа алу мақсатында қолданудың заңдылығына алаңдайды.
Біз тесттерді қолдануға қатысты бұл алаңдаушылықтарды олардың болжамдық құндылығынан бөлек қарастыруымыз керек. АҚШ армиясы осыдан бір ғасырдан астам уақыт бұрын ақыл-ой қабілеті тесттерін қолдана бастағалы бері когнитивтік тест ұпайлары мен кейінгі жұмыс өнімділігі арасындағы байланысты зерттейтін мыңдаған зерттеулер жүргізілді. Осы орасан зор зерттеулерден шығатын қорытынды айқын. Бір шолуда айтылғандай: «GMA қол жеткізілген кәсіби деңгейді де, таңдалған мамандық бойынша жұмыс өнімділігін де кез келген басқа қабілетке, мінез-құлыққа немесе бейімділікке қарағанда, тіпті жұмыс тәжірибесіне қарағанда да жақсы болжайды». Әрине, басқа да когнитивтік қабілеттер маңызды (бұл туралы кейінірек). Жауапкершілік және табандылық (ұзақ мерзімді мақсаттарға жету жолындағы қажымас қайрат пен құштарлық) сияқты мінез-құлық ерекшеліктері де маңызды. Иә, GMA тесттері өлшемейтін интеллекттің басқа түрлері де бар, мысалы, практикалық интеллект пен шығармашылық. Психологтар мен нейробиологтар кристалданған интеллект (жинақталған білім қорына сүйеніп мәселе шешу қабілеті) мен сұйық интеллект (мүлдем жаңа мәселелерді шешу қабілеті) арасын ажыратады.
Дегенмен, вербалды, сандық және кеңістіктік есептерден тұратын стандартталған тесттермен өлшенетін GMA барлық кемшіліктеріне қарамастан, маңызды нәтижелердің ең жақсы болжаушысы болып қала береді. GMA-ның болжау күші жоғары күрделіліктегі жұмыстар үшін арта түседі: интеллект қарапайым тапсырмаларды орындайтындарға қарағанда, зымыран жасаушы ғалымдар үшін маңыздырақ. Күрделі жұмыстар үшін тест ұпайлары мен жұмыс нәтижесі арасындағы корреляция . 50 шамасында (Ды = 67%). Біз атап өткендей, . 50 корреляциясы әлеуметтік ғылым стандарттары бойынша өте күшті болжамдық құндылықты білдіреді.
Кәсіби пайымдаулар туралы талқылауларда интеллектті өлшеуге қатысты жиі айтылатын қарсылық — мұндай шешім қабылдайтын адамдардың барлығы дерлік жоғары GMA-ға ие деген уәж. Дәрігерлер, судьялар немесе аға андеррайтерлер қарапайым халыққа қарағанда әлдеқайда білімді және когнитивтік қабілет тесттерінен жоғары ұпай алу ықтималдығы өте жоғары. Сіз жоғары GMA олардың арасында үлкен айырмашылық тудырмайды, бұл тек осы ортаға кіруге мүмкіндік беретін «кіру билеті» ғана деп ойлауыңыз мүмкін.
Бұл сенім кең таралған болса да, ол қате. Кәсіп түрлерінің төменгі сатысында GMA диапазоны жоғарыға қарағанда кеңірек екеніне күмән жоқ: төмен деңгейлі жұмыстарда жоғары GMA-лы адамдар кездеседі, бірақ заңгерлер, химиктер немесе инженерлер арасында орташа деңгейден төмен GMA-лы адамдар жоқтың қасы. Бұл тұрғыдан алғанда, жоғары ақыл-ой қабілеті беделді мамандықтарға қол жеткізудің қажетті шарты екені анық.
Алайда, бұл өлшем осы топтардың ішіндегі жетістіктер айырмашылығын көрсете алмайды. Тіпті когнитивтік қабілеті бойынша ең жоғарғы 1%-ға кіретін адамдардың арасында да (13 жасында бағаланған), ерекше нәтижелер GMA-мен тығыз байланысты. Осы топтың төменгі ширегіндегілермен салыстырғанда, жоғарғы ширегіндегілердің докторлық дәреже алу, кітап шығару немесе патент иелену ықтималдығы екі-үш есе жоғары. Басқаша айтқанда, GMA-дағы айырмашылық тек 99-шы және 80-ші немесе 50-ші пайыздықтар арасында ғана емес, сонымен бірге 99. 88-ші және 99. 13-ші пайыздықтар арасында да өте маңызды!
Қабілет пен нәтиже арасындағы байланыстың тағы бір айқын дәлелі ретінде 2013 жылғы зерттеуді келтіруге болады. Онда Fortune 500 компанияларының бас директорлары мен 424 американдық миллиардер (байлығы бойынша американдықтардың ең жоғарғы 0. 0001%-ы) қарастырылды. Күтілгендей, бұл гипер-элиталық топтар ең ақылды адамдардан тұратыны анықталды. Бірақ зерттеу осы топтардың ішінде де білім деңгейі мен қабілетінің жоғары болуы бас директорлардың жалақысына және миллиардерлердің таза байлығына оң әсер ететінін көрсетті. Айтпақшы, Стив Джобс, Билл Гейтс немесе Марк Цукерберг сияқты колледжді тастап кетіп, миллиардер болған атақты адамдар — «орманды жасырып тұрған ағаштар» іспетті: американдық ересектердің үштен бірі ғана колледж дипломына ие болса, миллиардерлердің 88%-ы жоғары білімді.
Қорытынды айқын. Пайымдауды қажет ететін мамандықтарда GMA жұмыс сапасына айтарлықтай үлес қосады, тіпті жоғары қабілетті адамдар тобының ішінде де солай. GMA-ның әсері тоқтайтын белгілі бір шек бар деген түсінік дәлелдермен расталмайды. Бұл қорытынды өз кезегінде, егер кәсіби пайымдауларды тексеру мүмкін болмаса, бірақ олар «көрінбейтін нысанаға» бағытталған деп есептелсе, онда қабілеті жоғары адамдардың шешімдері шындыққа жақын болу ықтималдығы жоғары екенін көрсетеді. Егер сізге пайымдау жасайтын адамдарды таңдау керек болса, ақыл-ой қабілеті ең жоғары жандарды таңдау қисынды.
Бірақ бұл пайымдаудың маңызды шектеуі бар. Сіз барлығына стандартталған тест бере алмайтындықтан, кімнің GMA-сы жоғары екенін болжауыңыз керек. Ал жоғары GMA көптеген бағыттарда, соның ішінде басқаларды өзіңіздің дұрыстығыңызға сендіру қабілетінде де нәтижені жақсартады. Ақыл-ой қабілеті жоғары адамдар басқаларға қарағанда жақсы шешім қабылдауға және шынайы сарапшы болуға бейім, бірақ олар сонымен бірге ешқандай кері байланыс болмаған жағдайда әріптестерін таңғалдыруға, сеніміне кіруге және мәртебелі сарапшы болуға да бейім. Ортағасырлық астрологтар өз заманының ең ақылды адамдарының қатарында болғаны анық.
Ақылды көрінетін, нық сөйлейтін және өз пайымдауларын дәлелді түрде жеткізе алатын адамдарға сенім арту қисынды болуы мүмкін, бірақ бұл стратегия жеткіліксіз және тіпті кері әсер етуі мүмкін. Олай болса, нағыз сарапшыларды анықтаудың басқа жолдары бар ма? Ең жақсы пайымдау жасайтын адамдардың басқа да танылатын қасиеттері бар ма?
Когнитивтік стиль
Ақыл-ой қабілетіне қарамастан, адамдар когнитивтік стильдері немесе пайымдау тапсырмаларына келу тәсілдері бойынша ерекшеленеді. Когнитивтік стильдерді анықтау үшін көптеген құралдар жасалған. Бұл өлшемдердің көпшілігі GMA-мен (және бір-бірімен) байланысты болса да, олар әртүрлі нәрселерді өлшейді.
Осындай өлшемдердің бірі — қазіргі уақытта кең таралған доп пен битта (жарғақ) туралы сұрақпен танымал болған когнитивтік рефлексия тесті (CRT — адамның алғашқы интуитивті, бірақ қате жауапты тексеріп, оны түзету қабілетін өлшеу). Сұрақ: «Доп пен биттаның жалпы құны — 1. 10 доллар. Битта доптан 1. 00 долларға қымбат. Доп қанша тұрады? » Тағы бір сұрақ: «Егер сіз жарыста екінші орында келе жатқан адамды басып озсаңыз, нешінші орында боласыз? » CRT сұрақтары адамдардың ойына келген бірінші (және қате) жауапты («он цент» және «бірінші») басып тастау ықтималдығын өлшеуге тырысады. Төмен CRT ұпайлары елестерге, астрологияға және экстрасенсорлық қабылдауға сену сияқты көптеген нақты өмірлік пайымдаулармен байланысты. Бұл ұпайлар адамдардың анық өтірік «фейк жаңалықтарға» қаншалықты сенетінін болжайды. Олар тіпті адамдардың смартфондарын қаншалықты жиі қолданатынымен де байланысты екені анықталған.
CRT-ді көптеген адамдар кеңірек ұғымды өлшеу құралы ретінде қарастырады: бұл рефлексивті (терең ойлану) және импульсивті (ойланбай әрекет ету) ойлау процестерін қолдануға бейімділік. Қарапайым тілмен айтқанда, кейбір адамдар мәселені мұқият ойлануды ұнатады, ал басқалары дәл сол мәселеге тап болғанда өздерінің алғашқы импульстеріне сенуге бейім. Біздің терминологиямызда CRT адамдардың жылдам, «1-жүйелік» ойлаудан гөрі, баяу, «2-жүйелік» ойлауға сену бейімділігінің өлшемі ретінде қарастырылуы мүмкін.
Бұл бейімділікті өлшеу үшін басқа да өзін-өзі бағалау тестілері жасалған. Мысалы, когнитивтік қажеттілік шкаласы адамдардан мәселелер туралы қаншалықты терең ойланғанды ұнататынын сұрайды. Бұл шкала бойынша жоғары ұпай алу үшін сіз «мен тек айтарлықтай ақыл-ой күшін жұмсау арқылы ғана қол жеткізуге болатын мақсаттарды қоюға бейіммін» дегенмен келісіп, «ойлану — мен үшін қызық емес» дегенмен келіспеуіңіз керек. Когнитивтік қажеттілігі жоғары адамдар белгілі когнитивтік ауытқуларға (қателіктерге) азырақ ұшырайды.
Тіпті кейбір қызықты заңдылықтар да тіркелген: егер сіз фильм туралы пікірлерді оқығанда спойлерден (алдын ала айтылатын мазмұн) қашсаңыз, сізде когнитивтік қажеттілік жоғары болуы мүмкін; ал бұл шкала бойынша төмен ұпай жинайтындар соңы алдын ала белгілі оқиғаларды ұнатады.
Бұл шкала өзін-өзі бағалауға негізделгендіктен және «әлеуметтік тұрғыдан дұрыс» жауап анық болғандықтан, ол біраз сұрақтар туғызады. Басқаларға жақсы әсер қалдырғысы келетін адам «Ойлану — мен үшін қызық емес» дегенді сирек мақұлдайды. Сол себепті басқа тесттер өзін-өзі сипаттаудың орнына дағдыларды өлшеуге тырысады.
Мысалы, «Ересектердің шешім қабылдау құзыреттілігі» шкаласы адамдардың пайымдау кезіндегі өзіне тым сенушілік немесе тәуекелді қабылдаудағы тұрақсыздық сияқты типтік қателіктерге қаншалықты бейім екенін өлшейді. Тағы бірі — Халперннің сыни ойлауды бағалау тесті. Бұл тестте сізге мынадай сұрақ қойылуы мүмкін: «Досыңыз сізден арықтауға арналған екі бағдарламаның қайсысын таңдау керектігі туралы кеңес сұрады делік. Бірінші бағдарлама клиенттерінің орташа есеппен жиырма бес фунт, ал екіншісі отыз фунт тастайтынын хабарлайды. Таңдау жасамас бұрын қандай сұрақтарға жауап алғыңыз келер еді? » Егер сіз, мысалы, «қанша адам осынша салмақ тастады? » және «олар сол нәтижені бір жыл немесе одан да көп уақыт сақтай алды ма? » деп жауап берсеңіз, сіз сыни ойлауды қолданғаныңыз үшін ұпай жинайсыз. Бұл тесттерден жақсы өткен адамдар өмірде де жақсы шешімдер қабылдайтын сияқты: олар жаман таңдаулардан туындайтын келеңсіз жағдайларға (мысалы, қажетсіз жүктілік немесе қарыздар) азырақ тап болады.
Когнитивтік стиль мен дағдылардың бұл өлшемдері пайымдауды жалпы болжайды деп есептеу қисынды. Алайда, олардың маңыздылығы тапсырмаға байланысты өзгереді. Зерттеушілер болжау қабілетін анықтайтын когнитивтік стильдерді іздегенде, когнитивтік қажеттіліктің қосымша ақпарат іздеуде немесе жоғары нәтиже көрсетуде шешуші рөл атқармайтынын анықтады.
Болжау нәтижесін анықтайтын жалғыз өлшем — психология профессоры Джонатан Барон жасаған белсенді ашық ойлау (өз көзқарасына қайшы келетін ақпаратты әдейі іздеу қабілеті) шкаласы болды. Белсенді ашық ойлау дегеніміз — сіздің бұрыннан бар гипотезаларыңызға қайшы келетін ақпаратты белсенді түрде іздеу. Бұған басқалардың өзгеше пікірлерін тыңдау және жаңа дәлелдерді ескі нанымдармен мұқият салыстыру жатады. Мұндай адамдар: «Өзіңнің қарама-қайшы уәжге көнуің — мінездің жақсылығының белгісі» деген тұжырыммен келіседі. Олар «пікіріңді өзгерту — әлсіздіктің белгісі» немесе «интуиция — шешім қабылдаудағы ең жақсы нұсқаушы» дегенмен келіспейді.
Басқаша айтқанда, когнитивтік рефлексия мен когнитивтік қажеттілік ұпайлары баяу және мұқият ойлауға бейімділікті өлшесе, белсенді ашық ойлау одан да асып түседі. Бұл — өз пайымдауының әлі де жетілдірілуі керек екенін үнемі сезінетін және түзетуге құштар жандардың қарапайымдылығы (кішіпейілділігі). Біз 21-тарауда бұл ойлау стилі ең үздік болжаушыларға тән екенін көреміз; олар жаңа ақпаратқа сәйкес өз пікірлерін үнемі қайта қарап отырады. Бір қызығы, белсенді ашық ойлаудың үйренуге болатын дағды екені туралы дәлелдер бар.
Біз бұл жерде нақты сала бойынша жақсы шешім қабылдайтын адамдарды қалай таңдау керектігі туралы кесімді қорытынды жасауды мақсат етпейміз. Бірақ бұл қысқаша шолудан екі жалпы принцип шығады. Біріншіден, сараптаманы шындықпен салыстырып тексеруге болатын салалар (мысалы, ауа райын болжау) мен мәртебелі сарапшылардың иелігіндегі салаларды ажырата білген жөн. Саяси сарапшы өте шешен әрі сенімді көрінуі мүмкін, ал шахмат гроссмейстері ұялшақ болып, өз жүрістерінің себебін түсіндіре алмауы мүмкін. Соған қарамастан, біз біріншісінің кәсіби пайымдауына екіншісіне қарағанда көбірек күмәнмен қарауымыз керек.
Екіншіден, кейбір бағалаушылар өздерінің тең дәрежелі және тәжірибелі әріптестерінен жақсырақ болады. Егер олар жақсырақ болса, олардың бейтарап болуы немесе «шуға» бой алдыру ықтималдығы азырақ. Бұл айырмашылықтарды түсіндіретін көптеген факторлардың ішінде интеллект пен когнитивтік стиль маңызды рөл атқарады. Ешқандай жалғыз өлшем пайымдау сапасын толық болжай алмаса да, сіз өз нанымдарына қайшы келетін жаңа ақпаратты белсенді іздейтін, сол ақпаратты өз көзқарасымен жүйелі түрде ұштастыра алатын және соның нәтижесінде өз пікірін өзгертуге дайын, тіпті құмбыл адамдарды іздегеніңіз абзал.
Өте жақсы пайымдау жасайтын адамдардың тұлғалық қасиеттері шешімді тез қабылдайтын көшбасшы туралы қалыптасқан стереотипке сәйкес келмеуі мүмкін. Адамдар көбінесе нық, түсінікті және ненің дұрыс екенін іштей бірден сезетін көшбасшыларға сенеді. Мұндай жетекшілер сенім ұялатады. Бірақ дәлелдер көрсеткендей, егер мақсат қателікті азайту болса, көшбасшылардың (және басқалардың) қарсы уәждерге ашық болуы және өздерінің қателесуі мүмкін екенін білуі әлдеқайда тиімді. Егер олар соңында шешім қабылдаса, бұл процестің басында емес, соңында болуы тиіс.
Жақсырақ бағалаушылар туралы:
— «Сіз сарапшысыз. Бірақ сіздің пайымдауларыңыз тексеріле ме, әлде сіз мәртебелі сарапшысыз ба? »
— «Бізге екі пікірдің бірін таңдау керек, бірақ бұл адамдардың тәжірибесі мен жетістіктері туралы ештеңе білмейміз. Ендеше, ақылдырағының кеңесіне құлақ түрейік».
— «Алайда, интеллект — мәселенің бір бөлігі ғана. Адамдардың қалай ойлайтыны да маңызды. Мүмкін, ең ақылдысын емес, ең терең ойланатын, ашық пікірлі адамды таңдауымыз керек шығар».
19-ТАРАУ
Шешімдерді қателіктерден тазарту және шешім қабылдау гигиенасы
Көптеген зерттеушілер мен ұйымдар пайымдауларды дебиасинг (қалыптасқан қисық ойлау немесе бейімділіктен арылту) жасауды мақсат етті. Бұл тарауда олардың негізгі тұжырымдары қарастырылады. Біз дебиасинг шараларының әртүрлі түрлерін ажыратып, одан әрі зерттеуге лайықты әдістердің бірін талқылаймыз. Содан кейін біз «шуды» азайту мәселесіне көшіп, «шешім қабылдау гигиенасы» идеясын енгіземіз.
Ex Post және Ex Ante дебиасинг
Дебиасингтің (дебиасинг – когнитивті бұрмалауларды түзету немесе азайту әдісі) екі негізгі тәсілін сипаттаудың жақсы жолы – өлшеу аналогиясына оралу. Сіздің ваннадағы таразыңыз салмағыңызға орта есеппен жарты фунт қосып көрсетеді делік. Демек, таразыңыз бұрмаланған. Бірақ бұл оны жарамсыз етпейді. Бұл бұрмалауды екі жолмен шешуге болады. Сіз әр өлшеген сайын таразы көрсеткішінен жарты фунтты алып тастап, нәтижені түзете аласыз. Әрине, бұл шаршатуы мүмкін (әрі ұмытып кетуіңіз де ғажап емес). Басқа жолы – шкаланы реттеп, аспаптың дәлдігін біржола жақсарту.
Өлшемдерді дебиасингтен өткізудің бұл екі тәсілі шешімдердегі бұрмалауларды түзету шараларына тікелей сәйкес келеді. Олар не экс-пост (оқиғадан кейінгі түзету) , яғни шешім қабылданғаннан кейін оны түзету арқылы, не экс-анте (алдын ала араласу) , яғни шешім немесе таңдау жасалмас бұрын әрекет ету арқылы жүзеге асады.
Экс-пост немесе түзетуші дебиасинг көбінесе интуитивті түрде орындалады. Айталық, сіз бір жобаға жауапты топты басқарып отырсыз және топ бұл жобаны үш айда бітіре аламыз деп есептейді. Сіз мүшелердің шешіміне буфер қосып, төрт айды немесе одан да көп уақытты жоспарлауыңыз мүмкін. Осылайша сіз бар деп есептейтін бұрмалауды (жоспарлау қателігін – жұмыстың мерзімі мен құнын тым төмен бағалау үрдісі ) түзетесіз.
Мұндай бұрмалауларды түзету кейде жүйелі түрде жүргізіледі. Біріккен Корольдікте Қазынашылық (HM Treasury) бағдарламалар мен жобаларды қалай бағалау керектігі туралы нұсқаулық – The Green Book-ты басып шығарды. Кітап жоспарлаушыларды жобаның құны мен ұзақтығының бағасына пайыздық түзетулер енгізу арқылы оптимистік бұрмалауларды шешуге шақырады. Бұл түзетулер идеалды жағдайда ұйымның тарихи оптимизм деңгейіне негізделуі тиіс. Егер мұндай тарихи деректер болмаса, The Green Book жобаның әр түрі үшін жалпылама түзету пайыздарын қолдануды ұсынады.
Экс-анте немесе алдын алушы дебиасинг шаралары өз кезегінде екі кең санатқа бөлінеді. Солардың ішіндегі ең перспективалылары шешім немесе таңдау жасалатын ортаны өзгертуге арналған. Мұндай модификациялар немесе надждар (таңдау архитектурасын өзгерту арқылы адамдарды белгілі бір шешімге итермелеу әдістері) деп аталатын әдістер бұрмалаулардың әсерін азайтуға немесе тіпті жақсырақ шешім қабылдау үшін сол бұрмалауларды пайдалануға бағытталған.
Қарапайым мысал – зейнетақы жоспарларына автоматты түрде тіркелу. Инерцияны, прокрастинацияны және оптимистік бұрмалауды жеңу үшін жасалған автоматты тіркеу қызметкерлердің, егер олар саналы түрде бас тартпаса, зейнетке ақша жинауын қамтамасыз етеді. Автоматты тіркеу қатысу деңгейін арттыруда өте тиімді екенін дәлелдеді. Бағдарлама кейде «Ертең көбірек үнемде» (Save More Tomorrow) жоспарларымен сүйемелденеді, бұл арқылы қызметкерлер болашақтағы жалақы өсімінің белгілі бір пайызын жинаққа бөлуге келісе алады. Автоматты тіркеуді көптеген жерлерде қолдануға болады — мысалы, «жасыл» энергияға, кедей балаларға арналған тегін мектеп тамағы жоспарларына немесе басқа да әртүрлі жеңілдіктер бағдарламаларына автоматты түрде қосу.
Басқа надждар таңдау архитектурасының әртүрлі аспектілерінде жұмыс істейді. Олар дұрыс шешімді ең оңай шешімге айналдыруы мүмкін — мысалы, психикалық денсаулық мәселелері бойынша көмек алу үшін әкімшілік кедергілерді азайту арқылы. Немесе олар өнімнің немесе әрекеттің белгілі бір сипаттамаларын айқын көрсетуі мүмкін — мысалы, бұрын жасырын болған комиссияларды ашық әрі түсінікті ету арқылы. Азық-түлік дүкендері мен веб-сайттар адамдардың бұрмалауларын жеңетіндей етіп оңай жобалануы мүмкін. Егер пайдалы тағамдар көрнекті жерлерге қойылса, көбірек адам оларды сатып алуы мүмкін.
Экс-анте дебиасингтің басқа түрі шешім қабылдаушыларды өз бұрмалауларын тануға және оларды жеңуге үйретуді қамтиды. Бұл шаралардың кейбірі бустинг (адамның білімі мен дағдысын арттыру арқылы шешім сапасын жақсарту) деп аталады; олар адамдардың әлеуетін арттыруды көздейді — мысалы, оларды статистикалық сауаттылыққа баулу арқылы.
Адамдарды өз бұрмалауларын жеңуге үйрету — игі іс, бірақ бұл көрінгеннен де қиын. Әрине, білім пайдалы. Мысалы, жоғары статистика курстарын жылдар бойы оқыған адамдар статистикалық пайымдауда қате жіберуге азырақ бейім. Бірақ адамдарды бұрмалаулардан қашуға үйрету қиын. Ондаған жылдар бойғы зерттеулер өз саласында бұрмалаулардан аулақ болуды үйренген мамандардың басқа салаларда бұл білімді қолдануға жиі қиналатынын көрсетті. Мысалы, синоптиктер өз болжамдарында шамадан тыс сенімділіктен аулақ болуды үйренген. Олар жаңбырдың жауу ықтималдығы 70% деп жарияласа, көбінесе уақыттың 70%-ында жаңбыр жауады. Соған қарамастан, жалпы білім туралы сұрақтар қойылғанда, олар басқа адамдар сияқты шамадан тыс сенімді болуы мүмкін. Бұрмалауды жеңуді үйренудегі басты қиындық — жаңа мәселенің біз бұрын көрген мәселеге ұқсас екенін және бір жерде кездескен бұрмалаудың басқа жерлерде де пайда болуы мүмкін екенін тануда.
Зерттеушілер мен педагогтар бұл тану процесін жеңілдету үшін дәстүрлі емес оқыту әдістерін қолдануда біршама табысқа жетті. Бір зерттеуде Бостон университетінің маманы Кэри Морведж және оның әріптестері оқу видеоларын және «байыпты ойындарды» (serious games) пайдаланды. Қатысушылар растау бұрмалауы (тек өз пікірін растайтын ақпаратты іздеу) , якорь эффектісі (алғашқы алынған ақпаратқа байланып қалу) және басқа да психологиялық бұрмалаулардан туындаған қателерді тануды үйренді. Әр ойыннан кейін олар жіберген қателіктері туралы кері байланыс алып, оларды қайталамау жолдарын білді. Ойындар (және азырақ дәрежеде видеолар) қатысушылардың тест кезінде жіберетін қателерінің санын азайтты, бұл нәтиже сегіз аптадан кейін ұқсас сұрақтар қойылғанда да сақталды. Бөлек зерттеуде Анн-Лор Селлье мен оның әріптестері растау бұрмалауын жеңуді үйрететін видео ойын ойнаған MBA студенттерінің бұл білімді басқа сабақта бизнес-кейсті шешу кезінде қолданғанын анықтады. Олар мұны тіпті екі жаттығудың арасында байланыс бар екені айтылмаса да жасаған.
Дебиасингтің шектеулері
Бұрмалауларды экс-пост түзетсе де немесе надждар мен бустинг арқылы олардың әсерінің алдын алса да, дебиасинг тәсілдерінің көпшілігінде бір ортақ нәрсе бар: олар нақты бір бұрмалауды нысанаға алады және оның бар екенін болжайды. Бұл жиі қисынды болып көрінетін болжам кейде қате болып шығады.
Жобаны жоспарлау мысалын тағы да қарастырайық. Сіз шамадан тыс сенімділік жалпы жобалық топтарға тән деп қисынды түрде болжай аласыз, бірақ нақты бір топқа әсер ететін жалғыз (немесе негізгі) бұрмалау осы екеніне сенімді бола алмайсыз. Мүмкін, топ жетекшісі ұқсас жобада жағымсыз тәжірибе жинап, бағалау кезінде өте сақ болуды үйренген шығар. Олай болса, топ сіз түзетпек болған қателікке мүлдем қарама-қарсы қателік жіберіп отыр. Немесе топ өз болжамын басқа ұқсас жобамен салыстыру арқылы жасап, сол жобаның аяқталу уақытына байланып (якорь эффектісі) қалған болар. Немесе жобалық топ сіздің бағалауға буфер қосатыныңызды болжап, сіздің түзетуіңіздің алдын алу үшін өз ұсынысын шынайы сенімінен де оптимистік етіп көрсеткен шығар.
Немесе инвестициялық шешімді алайық. Инвестицияның болашағына қатысты шамадан тыс сенімділік орын алуы мүмкін, бірақ басқа бір күшті бұрмалау — шығыннан қашу (loss aversion) — кері әсер етіп, шешім қабылдаушыларды бастапқы шығындарды жоғалту қаупінен сескендіреді. Немесе ресурстарды бірнеше жоба бойынша бөлетін компанияны қарастырыңыз. Шешім қабылдаушылар жаңа бастамалардың әсеріне тым сенімді болуы да (тағы да шамадан тыс сенімділік), сонымен қатар қолданыстағы бөлімшелерден ресурстарды бөлуде тым жасқаншақ болуы да мүмкін (бұл статус-кво бұрмалауынан – жағдайды сол күйінде қалдыруға деген бейімділік туындаған мәселе).
Осы мысалдар көрсеткендей, нақты қай психологиялық бұрмалаулар шешімге әсер етіп жатқанын дәл білу қиын. Кез келген күрделі жағдайда бірнеше психологиялық бұрмалаулар жұмыс істеп, қатені бір бағытқа жинақтауы немесе бір-бірін теңестіріп, болжап болмайтын салдарға әкелуі мүмкін.
Қорыта айтқанда, экс-пост немесе экс-анте дебиасинг нақты психологиялық бұрмалауларды түзететін немесе олардың алдын алатын жағдайларда пайдалы. Бұл тәсілдер қателіктің жалпы бағыты белгілі болғанда және ол анық статистикалық бұрмалау ретінде көрінгенде тиімді. Мысалы, жоспарлау қателігі — шамадан тыс сенімді жоспарлауға қарсы дебиасинг шараларын қолдануға негіз болатындай жеткілікті дәрежеде дәлелденген тұжырым.
Мәселе мынада: көптеген жағдайларда қателіктің ықтимал бағыты алдын ала белгілі болмайды. Мұндай жағдайларға психологиялық бұрмалаулардың әсері бағалаушылар арасында әртүрлі болатын және негізінен болжап болмайтын — нәтижесінде жүйелік шуға әкелетін барлық жағдайлар жатады. Мұндай жағдайларда қателікті азайту үшін бізге бір уақытта бірнеше психологиялық бұрмалауды анықтауға тырысатын кеңірек тор құру керек.
Шешім бақылаушысы
Біз бұрмалауларды іздеуді шешім қабылданғанға дейін де, одан кейін де емес, нақты уақыт режимінде жүргізуді ұсынамыз. Әрине, адамдар өз бұрмалауларының жетегінде жүргенде оны сирек сезеді. Бұл хабарсыздықтың өзі белгілі бір бұрмалау — бұрмалауларды байқамау аймағы (bias blind spot – өз қателігін көрмей, басқанікін тез байқау ). Адамдар көбінесе бұрмалауларды өзіне қарағанда басқалардан оңайырақ таниды. Біз бақылаушыларды басқа біреудің шешімдеріне немесе ұсыныстарына әсер ететін бір немесе бірнеше таныс бұрмалаулардың диагностикалық белгілерін нақты уақыт режимінде анықтауға үйретуге болады деп есептейміз.
Бұл процесс қалай жүретінін елестету үшін күрделі әрі маңызды шешім қабылдауға тырысатын топты көз алдыңызға келтіріңіз. Бұл кез келген шешім болуы мүмкін: пандемияға немесе басқа дағдарысқа жауап қайтаруды талқылайтын үкімет, күрделі симптомдары бар пациентті емдеудің ең жақсы жолын іздейтін дәрігерлер консилиумы немесе ірі стратегиялық қадамды шешетін компания директорлар кеңесі. Енді осы топты бақылап отырған және топты ең жақсы шешімнен алшақтатуы мүмкін кез келген бұрмалауды диагностикалау үшін бақылау парағын (чек-лист) пайдаланатын шешім бақылаушысын елестетіңіз.
Шешім бақылаушысы болу — оңай рөл емес, әрі кейбір ұйымдарда бұл мүмкін де емес. Егер түпкілікті шешім қабылдаушылар бұрмалаулармен күресуге ниетті болмаса, оларды анықтаудың пайдасы жоқ. Шындығында, шешім қабылдаушылардың өздері бақылау процесін бастауы және шешім бақылаушысының рөлін қолдауы тиіс. Біз сізге өз бетіңізше «шешім бақылаушысы» болуды ұсынбаймыз. Олай етсеңіз, дос та таппайсыз, адамдарға ықпал да ете алмайсыз.
Алайда, бейресми эксперименттер бұл тәсіл арқылы нақты ілгерілеуге болатынын көрсетеді. Кем дегенде, бұл тәсіл дұрыс жағдайларда, әсіресе ұйым немесе топ жетекшілері бұл жұмысқа шын ниетті болғанда және шешім бақылаушылары дұрыс таңдалып, өздері де айтарлықтай бұрмалауларға бейім болмағанда көмектеседі.
Мұндай жағдайларда шешім бақылаушылары үш санатқа бөлінеді: Кейбір ұйымдарда бұл рөлді жетекші атқара алады. Жобалық топ ұсынған ұсыныстардың тек мазмұнын ғана бақылаудың орнына, жетекші олардың дайындалу процесіне және топтың динамикасына мұқият назар аудара алады. Бұл бақылаушыға ұсынысты дайындау кезінде әсер етуі мүмкін бұрмалауларға сергек болуға мүмкіндік береді. Басқа ұйымдар әр жұмыс тобының бір мүшесін топтың «бұрмалауларды жоюшысы» етіп тағайындай алады; шешім қабылдау процесінің бұл сақшысы топ мүшелеріне оларды жаңылыстыруы мүмкін бұрмалауларды нақты уақыт режимінде ескертіп отырады. Бұл тәсілдің кемшілігі — шешім бақылаушысы топ ішіндегі «әзәзілдің адвокаты» позициясында қалып, саяси беделін тез жоғалтуы мүмкін. Соңында, басқа ұйымдар бейтарап көзқарастың артықшылығы бар сыртқы фасилитаторға (топтық талқылауды бағыттап, реттеп отыратын маман) жүгінуі мүмкін (бірақ бұл ішкі ақпараттың жетіспеушілігі мен қосымша шығындар сияқты кемшіліктерге ие).
Тиімді болу үшін шешім бақылаушыларына дайындық пен құралдар қажет. Осындай құралдардың бірі — олар анықтауға тырысатын бұрмалаулардың бақылау парағы. Бақылау парағына сүйенудің себебі түсінікті: бақылау парақтары маңызды жағдайларда шешімдерді жақсартудың ұзақ тарихына ие және өткен қателіктердің қайталануын болдырмау үшін өте қолайлы.
Міне, бір мысал. Америка Құрама Штаттарында федералды агенттіктер ауаны немесе суды тазартуға, жұмыс орнындағы өлім-жітімді азайтуға, азық-түлік қауіпсіздігін арттыруға, қоғамдық денсаулық сақтау дағдарыстарына жауап беруге немесе ұлттық қауіпсіздікті нығайтуға бағытталған қымбат ережелер шығармас бұрын ресми «реттеуші әсерді талдауды» жасауы тиіс. Көлемі елу бетке жуық, күрделі техникалық құжат (OMB Circular A-4) талдауға қойылатын талаптарды белгілейді. Бұл талаптар бұрмалауға қарсы тұру үшін жасалған. Агенттіктер ереженің не үшін қажет екенін түсіндіруі, балама нұсқаларды қарастыруы, шығындар мен пайданы есептеуі, ақпаратты бейтарап түрде ұсынуы және болашақты тиісті түрде ескеруі керек. Бірақ көптеген агенттіктерде шенеуніктер бұл күрделі техникалық құжаттың талаптарын орындамаған (мүмкін оны тіпті оқымаған да шығар). Бұған жауап ретінде федералды билік агенттіктердің негізгі талаптардың кез келгенін елемеу немесе назардан тыс қалдыру қаупін азайту үшін бар болғаны бір жарым беттен тұратын қарапайым бақылау парағын жасап шығарды.
Бұрмалаулардың бақылау парағы қандай болуы мүмкін екенін көрсету үшін біз B қосымшасына біреуін қостық. Бұл жалпылама бақылау парағы тек мысал ғана; кез келген шешім бақылаушысы оның өзектілігін арттыру және оңай қабылдануы үшін ұйымның қажеттіліктеріне бейімделген нұсқасын жасағысы келетіні сөзсіз. Маңыздысы, бақылау парағы — бұл шешімге әсер етуі мүмкін барлық бұрмалаулардың толық тізімі емес; ол ең жиі кездесетін және ең ауыр зардаптары бар бұрмалауларға назар аударуға бағытталған.
Тиісті бақылау парақтарын қолдана отырып шешімді бақылау бұрмалаулардың әсерін шектеуге көмектеседі. Бейресми, шағын көлемді жұмыстарда біршама көңіл көншітерлік нәтижелер көрсек те, біз бұл тәсілдің әсері немесе оны енгізудің әртүрлі тәсілдерінің жағымды және жағымсыз жақтары туралы жүйелі зерттеулерді білмейміз. Біз практиктер мен зерттеушілерді шешім бақылаушылары тарапынан нақты уақыт режиміндегі дебиасинг тәжірибесіне көбірек эксперимент жасауға шабыттандырамыз деп үміттенеміз.
Шуды азайту: Шешім гигиенасы
Бұрмалау — бұл біз жиі көре алатын және түсіндіре алатын қателік. Ол бағытталған: сондықтан надж бұрмалаудың зиянды әсерін шектей алады немесе шешімді жақсартуға (boost) бағытталған күш нақты бұрмалаулармен күресе алады. Ол сондай-ақ жиі көрініп тұрады: сондықтан бақылаушы шешім қабылдау кезінде нақты уақыт режимінде бұрмалауларды диагностикалауға үміттене алады.
Шу, керісінше, біз оңай көре алмайтын немесе түсіндіре алмайтын, болжап болмайтын қателік. Сондықтан біз оған жиі мән бермейміз — тіпті ол ауыр зардаптарға әкелсе де. Осы себепті шуды азайту стратегияларының дебиасингке қатынасы алдын алу гигиеналық шараларының медициналық емдеуге қатынасы сияқты: мақсат — кез келген нақтыланбаған ықтимал қателердің алдын алу.
Біз шуды азайтудың бұл тәсілін шешім гигиенасы (белгісіз қателердің алдын алуға бағытталған шаралар жиынтығы) деп атаймыз. Қолыңызды жуғанда, сіз нақты қай микробтан қорғанып жатқаныңызды білмеуіңіз мүмкін — сіз тек қол жуудың әртүрлі микробтардың алдын алудың жақсы жолы екенін білесіз (әсіресе пандемия кезінде ғана емес). Сол сияқты, шешім гигиенасы принциптерін сақтау дегеніміз — сіз қандай негізгі қателерден аулақ болуға көмектесіп жатқаныңызды ешқашан білместен, шуды азайтатын әдістерді қабылдайсыз дегенді білдіреді.
Қол жуумен салыстыру кездейсоқ емес. Гигиена шаралары жалықтырғыш болуы мүмкін. Олардың пайдасы тікелей көрінбейді; сіз олардың қандай мәселенің алдын алғанын ешқашан білмеуіңіз мүмкін. Керісінше, мәселе туындаған кезде, оны гигиена сақтаудың нақты бір бұзылуымен байланыстыру мүмкін болмауы мүмкін. Осы себептерге байланысты қол жуу тәртібін сақтауды қамтамасыз ету, тіпті оның маңыздылығын жақсы білетін медицина мамандарының арасында да қиынға соғады.
Қол жуу және алдын алудың басқа түрлері сияқты, шешім гигиенасы өте құнды, бірақ елеусіз. Нақты анықталған бұрмалауды түзету, кем дегенде, сізге бірдеңеге қол жеткізгеніңіз туралы сезім береді. Бірақ шуды азайтатын процедуралар мұндай сезім бермейді. Олар статистикалық тұрғыдан көптеген қателердің алдын алады. Дегенмен сіз қай қателер екенін ешқашан білмейсіз. Шу — көрінбейтін жау, ал көрінбейтін жаудың шабуылына тойтарыс беру тек көрінбейтін жеңіске әкеледі.
Шудың қаншалықты зиян келтіруі мүмкін екенін ескерсек, сол көрінбейтін жеңіс бәрібір күресуге тұрарлық. Келесі тарауларда сот сараптамасы, болжау, медицина және кадр ресурстары сияқты бірнеше салаларда қолданылатын шешім гигиенасының бірнеше стратегияларымен таныстырамыз. 25-тарауда біз бұл стратегияларды қарастырып, оларды шуды азайтудың интеграцияланған тәсіліне қалай біріктіруге болатынын көрсетеміз.
Дебиасинг және шешім гигиенасы туралы сөйлескенде
— «Сіз нақты қандай бұрмалаумен күресіп жатқаныңызды және оның нәтижеге қай бағытта әсер ететінін білесіз бе? Егер білмесеңіз, онда бірнеше бұрмалау жұмыс істеп тұрған болар және қайсысы басым болатынын болжау қиын».
— «Бұл шешімді талқылауды бастамас бұрын, шешім бақылаушысын тағайындайық».
— «Біз бұл шешім қабылдау процесінде жақсы шешім гигиенасын сақтадық; шешім мүмкіндігінше жақсы болуы әбден мүмкін».
20-ТАРАУ
Сот сараптамасындағы ақпаратты реттеу
2004 жылдың наурыз айында Мадридтегі қала маңындағы пойыздарға қойылған бомбалар сериясы 192 адамның өмірін қиып, 2000-нан астам адамды жарақаттады. Қылмыс болған жердегі пластик пакеттен табылған саусақ ізі Интерпол арқылы бүкіл әлемдегі құқық қорғау органдарына жіберілді. Бірнеше күннен кейін АҚШ Федералды тергеу бюросының (ФТБ) криминалистік зертханасы бұл саусақ ізі Орегон штатында тұратын Америка азаматы Брэндон Мэйфилдке тиесілі екенін сенімді түрде анықтады.
Мэйфилд күдіктіге ұқсайтын. АҚШ армиясының бұрынғы офицері, ол мысырлық әйелге үйленіп, ислам дінін қабылдаған еді. Адвокат ретінде ол Ауғанстанға барып, Талибанға қосылмақ болды деп айыпталған (кейін сотталған) адамдардың мүддесін қорғаған. Ол ФТБ-ның бақылау тізімінде болатын.
Мэйфилдтің соңынан бақылау орнатылып, үйіне тыңшарлар қойылып, тінту жүргізілді, телефондары тыңдалды. Бұл тексеру ешқандай маңызды ақпарат бермеген соң, ФТБ оны тұтқындады. Бірақ оған ешқашан ресми айып тағылған жоқ. Мэйфилд соңғы он жылда елден шықпаған еді. Ол қамауда болған кезде, ФТБ-ға Мэйфилдтің саусақ ізі пластик пакеттегі ізге сәйкес келмейді деп ескертіп қойған испан тергеушілері бұл ізді басқа күдіктімен сәйкестендірді.
Мэйфилд екі аптадан кейін босатылды. Соңында АҚШ үкіметі одан кешірім сұрап, 2 миллион доллар өтемақы төледі және қателіктің себептерін мұқият зерттеуге бұйрық берді. Оның негізгі тұжырымы: «Қателік әдістемелік немесе технологиялық ақау емес, адам факторынан болған қателік».
Бақытымызға орай, мұндай адам қателіктері сирек кездеседі. Дегенмен олар сабақ боларлық. Қалайша Америка Құрама Штаттарындағы ең үздік саусақ ізі мамандары қылмыс болған жерге жақындамаған адамның саусақ ізін қате сәйкестендірді? Мұны білу үшін алдымен саусақ ізін тексеру қалай жұмыс істейтінін және оның кәсіби пайымдаудың басқа мысалдарымен қалай байланысатынын түсінуіміз керек. Біз сот сараптамасындағы (қылмысты тергеуде ғылыми әдістерді қолдану саласы) саусақ ізін анықтаудың — біз оны нақты ғылым деп санауға бейім болсақ та — шын мәнінде сарапшылардың психологиялық бұрмалауларына тәуелді екенін білеміз. Бұл бұрмалаулар біз елестеткеннен де көп шу, демек, көбірек қателік тудыруы мүмкін. Сондай-ақ, біз сот сараптамасы қауымдастығының барлық ортада қолдануға болатын шешім гигиенасы стратегиясын енгізу арқылы бұл мәселені шешу үшін қандай қадамдар жасап жатқанын көреміз: бұл стратегия — шешім қабылдау үшін пайдаланылатын ақпарат ағынын қатаң бақылау.
Саусақ іздері
Саусақ іздері — бұл біздің саусақтарымыздың терісіндегі бүртікті қырқалардың біз ұстаған беттерде қалдыратын ізі. Көне заманда саусақ іздерінің сәйкестендіру белгісі ретінде пайдаланылғаны туралы мысалдар болғанымен, қазіргі заманғы саусақ ізімен сәйкестендіру XIX ғасырдың аяғында, шотланд дәрігері Генри Фолдс саусақ іздерін сәйкестендіру әдісі ретінде пайдалануды ұсынған алғашқы ғылыми мақаласын жариялаған кезден басталады.
Кейінгі онжылдықтарда саусақ іздері қылмыстық есепке алуда идентификациялық белгі ретінде таныла бастап, француз полиция қызметкері Альфонс Бертильон жасап шығарған антропометриялық өлшеу (адам денесінің пропорциялары мен өлшемдерін жүйелі түрде тіркеу әдісі) техникаларын біртіндеп ығыстырды. Бертильонның өзі 1912 жылы саусақ іздерін салыстырудың ресми жүйесін кодтады. Бұған дейін біз «тобыр даналығын» ашушы ретінде кездестірген сэр Фрэнсис Гальтон Англияда осыған ұқсас жүйені жасап шығарған болатын. (Дегенмен, бұл негізін қалаушы әкелердің сирек ұлықталуы таңқаларлық емес. Гальтон саусақ іздері адамдарды нәсіліне қарай жіктеудің пайдалы құралы болады деп сенді, ал Бертильон, бәлкім, антисемиттік көзқарастарының кесірінен, 1894 және 1899 жылдардағы Альфред Дрейфусқа қарсы сот процестерінде шешуші, бірақ қате сараптамалық айғақтар берді).
Көп ұзамай полиция қызметкерлері саусақ іздерінің тек бұрын сотталғандарды анықтаудан да маңыздырақ рөл атқара алатынын түсінді. 1892 жылы Аргентинадағы полиция қызметкері Хуан Вучетич алғаш рет қылмыс орнында қалған жасырын ізді (беткі қабатта көрінбейтін, арнайы өңдеуді қажет ететін саусақ ізі) күдіктінің бас бармағымен салыстырды. Содан бері жасырын іздерді жинау және оларды үлгілік іздермен (салыстыру үшін бақыланатын жағдайда алынған сапалы іздер) салыстыру тәжірибесі дактилоскопияның ең шешуші қолданысына айналып, криминалистік дәлелдеменің ең көп таралған түріне айналды.
Егер сіз электронды саусақ ізін оқу құрылғысын (көптеген елдердің көші-қон қызметтеріндегідей) кездестірген болсаңыз, саусақ іздерін салыстыруды қарапайым, механикалық және оңай автоматтандырылатын міндет деп ойлайтын шығарсыз. Бірақ қылмыс орнынан жиналған жасырын ізді үлгілік ізбен салыстыру екі таза ізді сәйкестендіруден әлдеқайда нәзік жұмыс. Саусақ ізін жазу үшін арнайы жасалған құрылғыны қатты басқанда, сіз ұқыпты, стандартталған кескін аласыз. Ал жасырын іздер көбінесе толық емес, түсініксіз, жағылған немесе бұрмаланған болып келеді; олар бақыланатын ортада жиналған із сияқты сапалы ақпарат бере алмайды. Жасырын іздер көбінесе сол адамның немесе басқа біреудің іздерімен қабаттасып қалады, сонымен қатар беткі қабаттағы кір мен басқа да қоспаларды қамтиды. Олардың күдіктінің үлгілік іздеріне сәйкес келетінін шешу сарапшылық пайымдауды талап етеді. Бұл — адам-сарапшылардың жұмысы.
Жасырын ізді алған кезде сарапшылар әдетте **ACE-V** деп аталатын процесті орындайды: Analysis (Талдау): Жасырын іздің салыстыру үшін жеткілікті құндылығы бар-жоғын анықтау. Comparison (Салыстыру): Ізді үлгілік ізбен салыстыру. Evaluation (Бағалау): Үш нәтиженің бірін шығару: идентификация (іздер бір адамға тиесілі), алып тастау (іздер бір адамға тиесілі емес) немесе анықталмаған шешім. Verification (Тексеру): Идентификация жасалған жағдайда, оны басқа сарапшы қайта тексереді.
Онжылдықтар бойы бұл процедураның сенімділігіне ешкім күмән келтірген жоқ. Куәгерлердің айғақтары қауіпті деңгейде сенімсіз екені, тіпті кінәні мойындаудың өзі жалған болуы мүмкін екені дәлелденсе де, саусақ іздері — кем дегенде ДНҚ сараптамасы пайда болғанға дейін — дәлелдеменің ең сенімді түрі ретінде қабылданды. 2002 жылға дейін АҚШ сотында саусақ ізі туралы дәлелдемеге ешкім сәтті түрде қарсы шыға алмаған. Сол кездегі ФБР сайтында: «Саусақ іздері жеке тұлғаны анықтаудың қателеспейтін құралы болып табылады», — деп нақты жазылған болатын. Қателіктер өте сирек кездескен жағдайда, олар біліксіздікке немесе алаяқтыққа байланысты деп есептелді.
Саусақ ізі айғақтарының ұзақ уақыт бойы күмән тудырмауының бір себебі — оның қате екенін дәлелдеудің қиындығы. Саусақ іздерінің нақты құндылығы, яғни қылмысты шын мәнінде кім жасағаны туралы ақиқат көбінесе белгісіз болып қалады. Мейфилд оқиғасы мен соған ұқсас бірнеше жағдайда қателік тым айқын болды. Бірақ жалпы алғанда, егер күдікті сарапшының қорытындысына қарсы шықса, саусақ ізі айғағы, әрине, сенімдірек деп есептеледі.
Біз нақты мәнді білмеу «шуды» өлшеуге кедергі емес екенін атап өткен болатынбыз. Саусақ ізі талдауында қаншалықты шу бар? Дәлірек айтсақ, саусақ ізі сарапшылары үкім шығаратын судьялар сияқты сан емес, санаттық шешім қабылдайтынын ескерсек, олар қаншалықты жиі келіспейді және неліктен? Бұл сұрақты бірінші болып Лондон университеттік колледжінің когнитивті нейробиология зерттеушісі Итиэль Дрор зерттей бастады. Ол өзінде «шу» мәселесі жоқ деп есептейтін салада бірқатар шу аудитін жүргізді.
Саусақ ізі талдауындағы жағдайлық шу
Когнитивті ғалымның — психологтың — саусақ ізі сарапшыларына күмән келтіруі оғаш көрінуі мүмкін. Өйткені, «CSI: Қылмыс орнын тергеу» сияқты телехикаялардан көргеніміздей, бұл мамандар латекс қолғап киген, микроскоппен жұмыс істейтін нақты ғылым өкілдері. Бірақ Дрор саусақ іздерін тексеру анық пайымдау мәселесі екенін түсінді. Ал когнитивті нейробиолог ретінде ол: «Пайымдау бар жерде шу да болуы керек», — деп есептеді.
Бұл гипотезаны тексеру үшін Дрор алдымен жағдайлық шуға назар аударды: бұл бір сарапшының бір дәлелдемені екі рет көргендегі шешімдерінің ауытқуы. Дрор айтқандай: «Егер сарапшылар өз-өзіне қайшы келсе, онда олардың пайымдаулары мен кәсібилігінің негізіне күмән туады».
Саусақ іздері жағдайлық шу аудиті үшін таптырмас сынақ алаңы болып табылады, өйткені дәрігер немесе судья кездесетін жағдайлардан айырмашылығы, іздер жұбын жаттап алу оңай емес. Әрине, сарапшылар іздерді ұмытуы үшін белгілі бір уақыт өтуі керек. (Дрордың зерттеулерінде кейбір батыл мамандар алдағы бес жыл ішінде өздеріне ескертпестен жүргізілетін зерттеулерге қатысуға келісім берген). Сонымен қатар, эксперимент мамандардың күнделікті жұмыс барысында өтуі тиіс, сонда олар өздерінің қабілеттері тексеріліп жатқанын білмейді. Егер осындай жағдайларда сарапшылардың шешімі бір сынақтан екіншісіне өзгерсе, бұл — жағдайлық шудың барының дәлелі.
Криминалистік растау бейімділігі
Дрор өзінің алғашқы зерттеулерінің екеуіне маңызды элемент қосты. Іздерді екінші рет көрсеткенде, кейбір сарапшыларға іс туралы қосымша «бағытталған» ақпарат берілді. Мысалы, бұған дейін іздерді «сәйкес келеді» деп тапқан сарапшыларға бұл жолы «күдіктінің алибиі бар» немесе «қару-жарақ сараптамасы оның қатысы жоқтығын көрсетеді» деп айтылды. Ал бұған дейін күдіктіні «кінәсіз» деп тапқан немесе шешім шығара алмаған басқа мамандарға екінші ретте «детектив күдіктінің кінәлі екеніне сенеді», «куәгерлер оны таныды» немесе «ол қылмысты мойындады» деп хабарланды. Дрор бұл экспериментті сарапшылардың «бейімделгіштігін» тексеру деп атады, өйткені берілген контекстік ақпарат белгілі бір бағыттағы психологиялық бейімділікті (растау бейімділігін — өз болжамына сәйкес келетін ақпаратты ғана қабылдау) іске қосты.
Шынында да, сарапшылар бейімділікке берілгіш болып шықты. Олар бұрын көрген іздерін бағытталған ақпаратпен бірге қайта қарағанда, шешімдері өзгерді. Бірінші зерттеуде бес сарапшының төртеуі «алып тастауды» меңзейтін күшті контекстік ақпарат берілгенде, өздерінің бұрынғы идентификациялық шешімін өзгертті. Екінші зерттеуде алты сарапшы төрт жұп ізді қайта қарады; бағытталған ақпарат жиырма төрт шешімнің төртеуінің өзгеруіне әкелді. Әрине, шешімдердің көпшілігі өзгерген жоқ, бірақ мұндай жауапты шешімдер үшін алтыдан бірінің өзгеруі үлкен көрсеткіш болып саналады. Бұл тұжырымдар кейіннен басқа зерттеушілер тарапынан да расталды.
Болжам бойынша, сарапшылар шешім қабылдау қиын болғанда, бағытталған ақпарат күшті болғанда және шешім «нақтыдан» «анықталмағанға» ауысқанда көбірек өзгерген. Дегенмен, «кәсіби саусақ ізі сарапшыларының шешімді іздегі нақты ақпаратқа емес, контекстке сүйеніп қабылдауы» алаңдатарлық жайт.
Бағытталған ақпараттың әсері тек сарапшының қорытындысымен (идентификация, анықталмаған немесе алып тастау) шектелмейді. Ол пайымдауды қалай түсіндіретініне ғана емес, сарапшының шын мәнінде нені көретініне де әсер етеді. Дрор мен оның әріптестері басқа зерттеуде бейімделген контекстке тап болған сарапшылардың ақпаратты мүлдем басқаша көретінін көрсетті. Жасырын із нысаналы үлгілік ізбен бірге берілгенде, сарапшылар жасырын ізді жеке көргендегіге қарағанда әлдеқайда аз детальдарды (минуцияларды — саусақ ізі бедерінің ұсақ ерекшеліктері) байқайды. Кейінгі тәуелсіз зерттеу бұл тұжырымды растап, оның «қалай болатыны әлі де жұмбақ» екенін қосты.
Дрор бағытталған ақпараттың әсеріне байланысты криминалистік растау бейімділігі (сарапшының іс туралы ақпарат әсерінен дәлелдемелерді біржақты бағалауы) деген терминді енгізді. Бұл бейімділік кейіннен қан іздерін талдау, өртті тергеу, қаңқа қалдықтарын талдау және сот-медициналық патология сияқты басқа криминалистік техникаларда да құжатталды. Тіпті криминалистикадағы жаңа алтын стандарт болып саналатын ДНҚ талдауының өзі — кем дегенде сарапшылар күрделі ДНҚ қоспаларын бағалауы тиіс болғанда — растау бейімділігіне ұшырауы мүмкін.
Криминалист мамандардың растау бейімділігіне бейімділігі тек теориялық мәселе емес, өйткені іс жүзінде сарапшылардың бағытталған ақпаратқа ұшырамауын қамтамасыз ететін жүйелі сақтық шаралары жоқ. Сарапшылар мұндай ақпаратты көбінесе айғақтармен бірге келетін жолдама хаттардан алады. Сондай-ақ, сарапшылар көбінесе полициямен, прокурорлармен және басқа сарапшылармен тікелей байланыста болады.
Растау бейімділігі тағы бір мәселені тудырады. ACE-V процедурасына енгізілген қателіктерден қорғаудың маңызды тетігі — идентификацияны растау алдында басқа сарапшының тәуелсіз тексеруі. Бірақ көбінесе тек идентификацияланған нәтижелер ғана тәуелсіз тексеріледі. Нәтижесінде растау бейімділігінің күшті қаупі туындайды, өйткені тексеруші сарапшы алғашқы қорытындының «идентификация» болғанын біледі. Сондықтан тексеру қадамы тәуелсіз пайымдауларды біріктіруден күтілетін нәтижені бермейді, өйткені тексерулер іс жүзінде тәуелсіз емес.
Мейфилд оқиғасында растау бейімділігінің «каскады» орын алған сияқты, онда екі емес, ФБР-дің үш сарапшысы қате идентификациямен келіскен. Кейінгі тергеу анықтағандай, бірінші сарапшы автоматтандырылған жүйенің деректер қорынан тапқан «сәйкестік деңгейіне» таң қалған. Ол Мейфилдтің өмірбаяндық мәліметтерімен таныс болмаса да, компьютерлік жүйенің нәтижелері және «өте жоғары деңгейдегі іспен жұмыс істеудің ішкі қысымы» алғашқы растау бейімділігін тудыруға жеткілікті болды. Бірінші сарапшы қате идентификация жасағаннан кейін, есепте айтылғандай, «кейінгі сараптамалар ластанған». Бірінші сарапшы үлкен құрметке ие жетекші болғандықтан, «агенттіктегі басқалар үшін онымен келіспеу қиындай түсті». Алғашқы қателік қайталанып, күшейе түсті, нәтижесінде Мейфилдтің кінәлі екеніне ешқандай күмән қалмады. Тіпті Мейфилдтің қорғауы үшін сот тағайындаған беделді тәуелсіз сарапшының өзі ФБР-мен келісіп, идентификацияны растаған.
Дәл осындай құбылыс басқа криминалистік салаларда да орын алуы мүмкін. Саусақ ізін сәйкестендіру криминалистикадағы ең объективті салалардың бірі болып саналады. Егер саусақ ізі сарапшылары бейімділікке берілсе, басқа сала мамандары да солай болуы мүмкін. Сонымен қатар, егер қару-жарақ сарапшысы саусақ іздерінің сәйкес келгенін білсе, бұл ақпарат оның да пайымдауына әсер етуі мүмкін. Бұл мысалдар «бейімділік каскадтарының» қаупін тудырады: 8-тарауда сипатталған топтық шешімдердегідей, растау бейімділігінен туындаған алғашқы қателік екінші сарапшыға әсер ететін бағытталған ақпаратқа айналады, оның пайымдауы үшіншісіне әсер етеді және осылай жалғаса береді.
Бағытталған ақпараттың ауытқу тудыратынын анықтағаннан кейін, Дрор мен оның әріптестері жағдайлық шудың көбірек дәлелдерін тапты. Тіпті сарапшыларға бағытталған ақпарат берілмесе де, олар кейде бұрын көрген іздері туралы пікірін өзгертеді. 2012 жылы ФБР тапсырысымен жүргізілген зерттеу 72 сарапшыдан жеті ай бұрын бағалаған 25 жұп ізді қайта қарауды сұрау арқылы бұл тұжырымды ауқымды деңгейде растады. Жоғары білікті сарапшылардың үлкен таңдамасымен жүргізілген зерттеу олардың кейде жағдайлық шуға бейім екенін дәлелдеді. Он шешімнің біреуі өзгерген. Өзгерістердің көпшілігі «анықталмаған» санатына қатысты болды және ешқайсысы жалған идентификацияға әкелген жоқ. Дегенмен, бұл зерттеудің ең алаңдатарлық тұсы — соттауға әкелген кейбір идентификациялар басқа уақытта «анықталмаған» деп танылуы мүмкін еді. Бір сарапшы бір ізді қарағанда, тіпті контекст барынша тұрақты болса да, олардың шешімдерінде сәйкессіздік бар.
Шу бар, бірақ қателік қаншалықты көп?
Бұл тұжырымдардан туындайтын практикалық сұрақ — сот қателіктерінің мүмкіндігі. Сотта айғақ беретін сарапшылардың сенімділігі туралы сұрақтарды елеусіз қалдыра алмаймыз: негізділік сенімділікті талап етеді, өйткені егер сіз өз-өзіңізбен келісе алмасаңыз, шындықпен келісу қиын болады.
Қате криминалистикалық ғылымның кесірінен нақты қанша қателік орын алады? Кінәсіздік жобасы (Innocence Project) — қате сотталғандардың ісін қайта қараумен айналысатын коммерциялық емес ұйым — анықтаған 350 ақтау оқиғасына жасалған шолу көрсеткендей, істердің 45%-ында криминалистиканың дұрыс қолданылмауы себептердің бірі болған. Бұл статистика жаман көрінеді, бірақ судьялар мен алқабилер үшін маңызды сұрақ басқа: сарапшыға қаншалықты сенуге болатынын білу үшін олардың маңызды қателік жіберу ықтималдығын білуі керек.
Бұл сұраққа ең толық жауапты 2016 жылы қылмыстық соттардағы криминалистикаға терең шолу жасаған Президенттің ғылым және технология жөніндегі кеңесшілер кеңесінің (PCAST) есебінен табуға болады. Есеп саусақ ізі талдауының негізділігі және әсіресе Мейфилд ісіндегідей қате идентификациялардың (жалған позитивті нәтижелер) ықтималдығы туралы қолжетімді дәлелдерді жинақтаған.
Бұл дәлелдер таңқаларлықтай аз және PCAST атап өткендей, мұндай зерттеулердің тек жақында ғана басталғаны «өкінішті». Ең сенімді деректер ФБР ғалымдарының 2011 жылы жүргізген жалғыз ірі зерттеуінен алынды. Зерттеуге 169 сарапшы қатысып, әрқайсысы 100-ге жуық жасырын және үлгілік іздерді салыстырды. Негізгі тұжырым — қате идентификациялар өте аз болған: жалған позитивті нәтижелер жиілігі шамамен 600-ден 1-ді құрады.
Алты жүзден бір қателік көрсеткіші төмен, бірақ есепте айтылғандай, бұл «жалпы жұртшылықтың (және алқабилердің) саусақ ізі талдауының дәлдігі туралы бұрыннан келе жатқан мәлімдемелерге сүйеніп сенетін көрсеткішінен әлдеқайда жоғары». Сонымен қатар, бұл зерттеуде бағытталған контекстік ақпарат болған жоқ және сарапшылар өздерінің сынақтан өтіп жатқанын білді, бұл нақты жұмыс барысындағы қателіктерді тым аз көрсетуі мүмкін. Флоридада жүргізілген кейінгі зерттеу жалған позитивті нәтижелердің әлдеқайда жоғары санын көрсетті. Әртүрлі тұжырымдар бұл салада көбірек зерттеу қажет екенін білдіреді.
Барлық зерттеулерде байқалатын бір жұбатарлық жайт — сарапшылар өте сақ болуға тырысады. Олардың дәлдігі мінсіз емес, бірақ олар өз шешімдерінің салдарын жақсы түсінеді. Саусақ ізіне деген сенім өте жоғары болғандықтан, қате идентификация қайғылы салдарға әкелуі мүмкін. Қателіктің басқа түрлері онша маңызды емес. Мысалы, ФБР сарапшылары: «Көп жағдайда алып тастау шешімі анықталмаған шешіммен бірдей маңызға ие», — деп есептейді. Басқаша айтқанда, кісі өлтіру қаруынан саусақ ізінің табылуы кінәлауға жеткілікті, бірақ іздің болмауы күдіктіні ақтауға жеткіліксіз.
Сарапшылардың сақтығы туралы бақылауымызға сәйкес, деректер олардың идентификация жасамас бұрын екі рет, тіпті одан да көп ойланатынын көрсетеді. ФБР зерттеуінде бір адамға тиесілі іздер жұбының үштен бірінен азы ғана «идентификация» деп дәл танылған. Сондай-ақ сарапшылар жалған теріс (алып тастау) шешімдерге қарағанда жалған позитивті (идентификация) шешімдерді әлдеқайда аз қабылдайды. Олар бейімділікке берілгіш, бірақ екі бағытта бірдей емес. Дрор атап өткендей: «Криминалистерді нақты „идентификациядан“ көрі бейтарап „анықталмаған“ шешіміне қарай бағыттау оңайырақ».
Сарапшылар қате идентификациядан кез келген жолмен қашу керек деген принциппен оқытылады. Олар осы принципке сәйкес әрекет етеді. Олардың бұл мұқияттылығы Мейфилд ісіндегідей қателіктерді өте сирек деңгейде сақтайды деп үміттенеміз.
Шуға құлақ түру
Криминалистикада шу бар екенін айту — криминалистерді сынау емес. Бұл біз бірнеше рет атап өткен бақылаудың салдары ғана: пайымдау бар жерде шу бар және ол сіз ойлағаннан да көп. Саусақ іздерін талдау сияқты міндет өте объективті болып көрінетіні сонша, көбіміз оны пайымдау түрі ретінде қабылдамаймыз. Дегенмен, мұнда да сәйкессіздіктерге, келіспеушіліктерге және кейде қателіктерге орын бар. Саусақ ізін сәйкестендірудің қателік деңгейі қаншалықты төмен болса да, ол нөл емес және PCAST атап өткендей, алқабилер бұдан хабардар болуы тиіс.
Шуды азайтудың бірінші қадамы — оның мүмкін екенін мойындау. Бұл мойындау дактилоскопия мамандары үшін оңай емес, олардың көбісі бастапқыда Дрордың шу аудитіне күмәнмен қарады. Сарапшының іс туралы ақпаратпен еріксіз әсерленуі мүмкін деген ой көптеген мамандардың намысына тиді. Дрордың зерттеуіне жауап ретінде Саусақ ізі қоғамының төрағасы: «Шешім қабылдау кезінде бағытталған ақпаратқа берілетін кез келген сарапшы соншалықты жетілмеген, ол Диснейлендтен жұмыс іздеуі керек», — деп жазды. Ірі криминалистік зертхананың директоры іс туралы ақпаратқа қол жеткізу «сарапшыларға өз жұмысынан ләззат алуға мүмкіндік беретін жеке қанағаттану сезімін сыйлайды, бірақ олардың пайымдауын өзгертпейді» деп атап өтті. Тіпті ФБР Мейфилд ісін іштей тергегенде: «Жасырын із сарапшылары әдетте тексеру жүргізгенде алдыңғы сарапшының нәтижесін біледі, бірақ бұл нәтижелер сарапшының қорытындысына әсер етпейді», — деп мәлімдеді. Бұл ескертулер негізінен растау бейімділігінің бар екенін жоққа шығарумен бірдей.
Тіпті біржақтылық қаупін білген күннің өзінде, сот-медициналық сарапшылары біржақтылықтың соқыр дағынан (өзгелердің қателігін көріп, өзінікін байқамау бейімділігі) қорғалмаған. Жиырма бір елдегі төрт жүз кәсіби сот-медициналық сарапшы арасында жүргізілген сауалнамада респонденттердің 71%-ы «когнитивті біржақтылық жалпы сот сараптамасы ғылымдарында алаңдаушылық тудырады» деген пікірмен келіскен, бірақ тек 26%-ы ғана «менің жеке пайымдауларыма когнитивті біржақтылық әсер етеді» деп ойлайды. Басқаша айтқанда, бұл сот сараптамасы мамандарының жартысына жуығы әріптестерінің пайымдауларында «шу» бар деп есептейді, бірақ өздерінде ондай жоқ деп санайды. Шу — тіпті көрінбейтінді көру міндеті жүктелген адамдар үшін де байқалмайтын мәселе болуы мүмкін.
Ақпаратты ретпен беру
Дрор мен оның әріптестерінің табандылығының арқасында көзқарастар баяу өзгеруде және сот-медициналық зертханалардың өсіп келе жатқан саны өз талдауларындағы қателерді азайту үшін жаңа шаралар қабылдай бастады. Мысалы, PCAST есебі ФБР зертханасын растау біржақтылығының қаупін азайту үшін өз процедураларын қайта жасақтағаны үшін жоғары бағалады.
Қажетті әдістемелік қадамдар салыстырмалы түрде қарапайым. Олар көптеген салаларда қолданылатын шешім қабылдау гигиенасының стратегиясын көрсетеді: ерте қалыптасатын интуицияны шектеу үшін ақпаратты ретпен беру. Кез келген пайымдауда кейбір ақпарат маңызды, ал кейбірі маңызды емес. Ақпараттың көп болғаны әрдайым жақсы емес, әсіресе егер ол судьяның немесе сарапшының мерзімінен бұрын интуиция қалыптастыруына әкеліп, пайымдауды бұрмалауға мүмкіндігі болса.
Осы орайда, сот зертханаларында енгізілген жаңа процедуралар сарапшыларға тек қажетті ақпаратты, қажет кезінде ғана беру арқылы олардың пайымдауларының тәуелсіздігін қорғауға бағытталған. Басқаша айтқанда, зертхана оларды іс туралы мүмкіндігінше бейхабар ұстайды және ақпаратты тек біртіндеп ашады. Дрор мен әріптестері жүйелеген бұл тәсіл сызықтық дәйекті ашу (linear sequential unmasking - сарапшыға ақпаратты біртіндеп, тек қажет кезінде ашу әдісі) деп аталады.
Дрордың осы шешім гигиенасы стратегиясын көрсететін тағы бір ұсынысы бар: сарапшылар өз пайымдауларын әр қадам сайын құжаттап отыруы тиіс. Олар сәйкестікті анықтау үшін үлгі саусақ іздеріне қарамас бұрын, табылған саусақ ізіне жасаған талдауларын құжаттауы керек. Бұл қадамдар тізбегі мамандарға тек өздері іздеген нәрсені ғана көру қаупінен аулақ болуға көмектеседі. Сондай-ақ, олар өздерін біржақтылыққа итермелейтін контекстік ақпаратты алмас бұрын, айғақтар бойынша өз пайымдауларын жазып алуы тиіс. Егер олар контекстік ақпаратпен танысқаннан кейін өз ойларын өзгертсе, бұл өзгерістер мен олардың негіздемесі құжатталуы керек. Бұл талап алғашқы интуицияның бүкіл процесті бұрмалау қаупін шектейді.
Осы логика шешім гигиенасының маңызды бөлігі болып табылатын үшінші ұсынысқа негіз болады. Бірінші адам жасаған сәйкестендіруді тексеру үшін басқа сарапшы шақырылғанда, екінші адам бірінші пайымдаудан хабарсыз болуы керек.
Сот сараптамасында шудың болуы, әрине, өмір мен өлім мәселесіне әсер етуі мүмкін болғандықтан алаңдатарлық жағдай. Бірақ бұл сонымен қатар көп нәрсені аңғартады. Біздің саусақ іздерін сәйкестендірудегі қателік мүмкіндігін ұзақ уақыт бойы мүлдем сезбегеніміз — сарапшылардың пайымдауына деген сеніміміздің кейде тым асыра сілтенетінін және шу аудиті күтпеген мөлшердегі шуды қалай ашатынын көрсетеді. Бұл кемшіліктерді салыстырмалы түрде қарапайым процесс өзгерістері арқылы азайту мүмкіндігі шешімдердің сапасын жақсартуға ниетті жандардың барлығына жігер беруі тиіс.
Бұл жағдай көрсететін негізгі шешім гигиенасы стратегиясы — ақпаратты ретпен беру — жағдаяттық шудан қорғау құралы ретінде кеңінен қолданылады. Біз атап өткендей, жағдаяттық шу (occasion noise - бір адамның бір мәселе бойынша әртүрлі уақытта әртүрлі шешім қабылдауы) көңіл-күй, тіпті сыртқы температура сияқты сансыз факторлардың әсерінен болады. Сіз бұл факторлардың барлығын бақылауда ұстай алмайсыз, бірақ пайымдауларды ең айқын факторлардан қорғауға тырыса аласыз. Мысалы, пайымдаулар ашу, қорқыныш немесе басқа эмоциялардың әсерінен өзгеруі мүмкін екенін білесіз және мүмкін болса, жағдаяттық шудың факторлары әртүрлі болуы ықтимал басқа уақыт аралықтарында өз пайымдауыңызды қайта қарау жақсы тәжірибе екенін байқаған боларсыз.
Азырақ байқалатын жағдай — сіздің пайымдауыңыз жағдаяттық шудың тағы бір факторы — ақпарат арқылы өзгеруі мүмкін, тіпті ол ақпарат нақты болса да. Саусақ ізі сарапшыларының мысалындағыдай, сіз басқалардың не ойлайтынын білген бойда, растау біржақтылығы сізді жалпы әсерді тым ерте қалыптастыруға және қарама-қайшы ақпаратты елемеуге мәжбүр етуі мүмкін. Хичкоктың екі фильмінің атауы мұны жақсы түйіндейді: жақсы шешім қабылдаушы «күдік ұшқынын» сақтауға тырысуы керек, «бәрін тым көп білетін адам» болмауы тиіс.
Ақпаратты ретпен беру туралы айтқанда
«Пайымдау бар жерде шу да бар — бұл саусақ іздерін оқуға да қатысты».
«Бізде бұл іс туралы көбірек ақпарат бар, бірақ сарапшыларды біржақтылыққа итермелемес үшін, олар өз пайымдауын жасағанға дейін біз білетін нәрсенің бәрін айтпайық. Шын мәнінде, оларға тек білуі тиіс нәрсені ғана айтайық».
«Егер екінші пікірді айтушы адам бірінші пікірдің қандай болғанын білсе, ол пікір тәуелсіз болмайды. Ал үшіншісі тіпті тәуелсіз емес: мұнда біржақтылық каскады орын алуы мүмкін».
«Шумен күресу үшін олар алдымен оның бар екенін мойындауы керек».
21-ТАРАУ Болжам жасаудағы іріктеу және біріктіру
Көптеген пайымдаулар болжам жасауды қамтиды. Келесі тоқсанда жұмыссыздық деңгейі қандай болуы мүмкін? Келесі жылы қанша электромобиль сатылады? 2050 жылы климаттың өзгеруінің салдары қандай болады? Жаңа ғимаратты салуға қанша уақыт кетеді? Белгілі бір компанияның жылдық табысы қанша болады? Жаңа қызметкер өзін қалай көрсетеді? Ауаны ластауға қатысты жаңа ереженің құны қанша болады? Сайлауда кім жеңеді? Мұндай сұрақтардың жауаптары үлкен салдарға ие. Жеке және мемлекеттік институттардың іргелі таңдаулары көбінесе соларға байланысты болады.
Болжамды талдаушылар — оның қашан және неге қате кететінін зерттейтіндер — біржақтылық пен шудың (оны сәйкессіздік немесе сенімсіздік деп те атайды) арасын нақты ажыратады. Кейбір контексттерде болжам жасаушылардың біржақты екендігімен бәрі келіседі. Мысалы, ресми ведомстволар өздерінің бюджеттік болжамдарында шындыққа жанаспайтын оптимизм танытады. Орташа алғанда, олар экономикалық өсуді негізсіз жоғары, ал тапшылықты негізсіз төмен етіп көрсетеді. Практикалық мақсаттар үшін олардың бұл оптимизмі когнитивті біржақтылықтың нәтижесі ме, әлде саяси ойлар ма, ол маңызды емес.
Сонымен қатар, болжам жасаушылар өздеріне тым сенімді болуға бейім: егер олардан болжамдарын нақты бір сан ретінде емес, сенім аралықтары (confidence intervals - көрсеткіштің нақты мәні болуы ықтимал диапазон) түрінде тұжырымдауды сұраса, олар қажеттіліктен әлдеқайда тар ауқымдарды таңдайды. Мысалы, тоқсан сайынғы сауалнама АҚШ компанияларының қаржы директорларынан келесі жылға арналған S&P 500 индексінің жылдық табысын бағалауды сұрайды. Қаржы директорлары екі санды береді: нақты табыстың одан төмен болу ықтималдығы оннан бір деп есептейтін минимум және нақты табыстың одан жоғары болу ықтималдығы оннан бір деп есептейтін максимум. Осылайша, бұл екі сан 80 пайыздық сенім аралығының шекаралары болып табылады. Дегенмен, іс жүзіндегі табыстар бұл аралыққа тек 36% жағдайда ғана сәйкес келеді. Қаржы директорлары өз болжамдарының дәлдігіне тым сенімді.
Болжам жасаушылардың арасында да шу көп кездеседі. Дж. Скотт Армстронгтың «Болжам жасау принциптері» (Principles of Forecasting) атты негізгі еңбегінде тіпті сарапшылар арасында да «сенімсіздік болжамдық пайымдаудағы қателердің қайнар көзі» екендігі атап өтіледі. Шын мәнінде, шу — қателіктің негізгі көзі. Жағдаяттық шу жиі кездеседі; болжам жасаушылар әрдайым өз пікірлерімен келісе бермейді. Тұлғааралық шу да кең таралған; тіпті мамандар болса да, болжам жасаушылар бір-бірімен келіспейді. Егер сіз заң профессорларынан Жоғарғы Соттың шешімдерін болжауды сұрасаңыз, сіз көптеген шуды табасыз. Егер мамандардан ауаны ластауды реттеудің жылдық пайдасын болжауды сұрасаңыз, сіз үлкен ауытқуларды көресіз, мысалы, 3 миллиард доллардан 9 миллиард долларға дейінгі ауқым. Егер экономистер тобынан жұмыссыздық пен өсім туралы болжам жасауды сұрасаңыз, сіз тағы да үлкен ауытқуларды байқайсыз. Біз шулы болжамдардың көптеген мысалдарын көрдік, ал болжам жасау бойынша зерттеулер одан да көп мысалдарды ашады.
Болжамдарды жақсарту
Зерттеулер шу мен біржақтылықты азайту бойынша ұсыныстарды да ұсынады. Біз оларды бұл жерде толығымен қарастырмаймыз, бірақ кеңінен қолданылатын екі шуды азайту стратегиясына тоқталамыз. Бірі — 18-тарауда айтылған принципті қолдану: жақсырақ судьяларды іріктеу жақсырақ пайымдауларға әкеледі. Екіншісі — ең әмбебап қолданылатын шешім гигиенасы стратегияларының бірі: бірнеше тәуелсіз бағалауларды біріктіру.
Бірнеше болжамды біріктірудің ең оңай жолы — олардың орташа мәнін алу. Орташа мәнді есептеу шуды математикалық түрде азайтуға кепілдік береді: атап айтқанда, ол шуды орташаланған пайымдаулар санының квадрат түбіріне бөледі. Бұл дегеніміз, егер сіз жүз пайымдауды орташаласаңыз, сіз шуды 90%-ға, ал төрт жүз пайымдауды орташаласаңыз, оны 95%-ға азайтасыз — яғни оны іс жүзінде жоясыз. Бұл статистикалық заң 7-тарауда талқыланған «көпшілік даналығы» тәсілінің қозғалтқышы болып табылады.
Орташа мәнді алу біржақтылықты азайту үшін ештеңе жасамайтындықтан, оның жалпы қателікке (MSE - орташа квадраттық қате) әсері ондағы біржақтылық пен шудың пропорцияларына байланысты. Сондықтан көпшілік даналығы пайымдаулар тәуелсіз болған кезде және ортақ біржақтылықтардың болу ықтималдығы төмен болған кезде жақсы жұмыс істейді. Эмпирикалық тұрғыдан алғанда, көптеген дәлелдер бірнеше болжамды орташалау дәлдікті айтарлықтай арттыратынын көрсетеді, мысалы, экономикалық болжамшылардың немесе қор нарығы талдаушыларының «консенсус» болжамында. Сатуды болжау, ауа райын болжау және экономикалық болжам жасауға қатысты болсақ, болжамшылар тобының салмақсыз орташа мәні көптеген жеке болжамдардан, ал кейде барлық жеке болжамдардан асып түседі. Әртүрлі әдістермен алынған болжамдарды орташалау да дәл осындай нәтиже береді: әртүрлі салалардағы отыз эмпирикалық салыстыруды талдау барысында біріктірілген болжамдар қателіктерді орташа есеппен 12,5%-ға азайтты.
Таңдаулы топ (select-crowd) стратегиясы: соңғы пайымдауларының дәлдігіне қарай ең жақсы судьяларды іріктейді және аз ғана судьялардың (мысалы, бесеуінің) пайымдауларын орташалайды. Бұл стратегия жай орташалау сияқты тиімді болуы мүмкін. Сондай-ақ, сараптаманы құрметтейтін шешім қабылдаушылар үшін тек біріктіруге ғана емес, сонымен қатар іріктеуге негізделген стратегияны түсіну және қабылдау оңайырақ. Болжам нарықтары (prediction markets): мұнда жеке тұлғалар ықтимал нәтижелерге бәс тігеді және осылайша дұрыс болжам жасауға ынталандырылады. Көп жағдайда болжам нарықтары өте жақсы нәтиже көрсетеді: егер нарықтағы баға оқиғаның орындалу ықтималдығы 70% екенін көрсетсе, ол шамамен 70% жағдайда орындалады. Әртүрлі салалардағы көптеген компаниялар әртүрлі көзқарастарды біріктіру үшін болжам нарықтарын пайдаланды. Дельфи әдісі (Delphi method): оның классикалық түрінде қатысушылар модераторға өз бағалауларын (немесе дауыстарын) жіберетін және бір-бірі үшін жасырын болып қалатын бірнеше раундтарды қамтиды. Әрбір жаңа раундта қатысушылар өз бағалауларының себептерін көрсетеді және басқалар келтірген себептерге әлі де жасырын түрде жауап береді. Бұл процесс бағалаулардың жақындасуына ықпал етеді. Әдіс біріктіруден де, әлеуметтік оқытудан да пайда көреді.
Дельфи әдісі көптеген жағдайларда жақсы жұмыс істеді, бірақ оны жүзеге асыру қиын болуы мүмкін. Оның қарапайым нұсқасы — мини-Дельфи, оны бір жиналыс ішінде өткізуге болады. Оны сондай-ақ «бағалау-талқылау-бағалау» деп те атайды. Ол қатысушылардан алдымен бөлек (және үнсіз) бағалаулар жасауды, содан кейін оларды түсіндіруді және негіздеуді, соңында басқалардың бағалаулары мен түсіндірмелеріне жауап ретінде жаңа бағалау жасауды талап етеді. Консенсус пайымдауы — сол екінші раундта алынған жеке бағалаулардың орташа мәні.
«Жақсы пайымдау» жобасы (The Good Judgment Project)
Болжам жасау сапасы бойынша ең жаңашыл жұмыстардың кейбірі 2011 жылы басталды, сол кезде үш танымал мінез-құлық ғалымы «Жақсы пайымдау» жобасын (The Good Judgment Project) құрды. Филип Тетлок (біз оны 11-тарауда саяси оқиғалардың ұзақ мерзімді болжамдарын бағалауын талқылағанда кездестірдік); оның жұбайы Барбара Меллерс және Дон Мур болжам жасауды түсінуді жақсарту үшін және, атап айтқанда, неге кейбір адамдар бұл істе шебер екенін анықтау үшін бірікті.
«Жақсы пайымдау» жобасы ондаған мың еріктілерді — мамандарды немесе сарапшыларды емес, әртүрлі саладағы қарапайым адамдарды жинаудан басталды. Олардан жүздеген сұрақтарға жауап беру сұралды, мысалы:

Солтүстік Корея жыл соңына дейін ядролық құрылғыны жара ма?

Ресей алдағы үш айда Украинаның қосымша аумақтарын ресми түрде аннексиялай ма?

Үндістан немесе Бразилия алдағы екі жылда БҰҰ Қауіпсіздік Кеңесінің тұрақты мүшесі бола ма?

Келесі жылы еуроаймақтан қандай да бір ел шыға ма?
Бұл мысалдар көрсетіп отырғандай, жоба әлемдік оқиғалар туралы ірі сұрақтарға бағытталған. Маңыздысы, мұндай сұрақтарға жауап беру әрекеттері күнделікті болжамдардағы сияқты көптеген проблемаларды тудырады. Егер адвокат клиенттің сотта жеңетінін немесе телестудия ұсынылған шоудың үлкен хит болатынын сұраса, бұл жерде болжам жасау дағдылары іске қосылады. Тетлок пен оның әріптестері кейбір адамдардың ерекше жақсы болжамшы екенін білгісі келді. Сондай-ақ олар болжам жасау қабілетін үйретуге немесе кем дегенде жақсартуға болатынын білгісі келді.
Негізгі тұжырымдарды түсіну үшін Тетлок пен оның командасы болжамшыларды бағалау үшін қабылдаған әдістің кейбір негізгі аспектілерін түсіндіруіміз керек. Біріншіден, олар сәттілік немесе сәтсіздік үшін кездейсоқтық жауапты болуы мүмкін бір немесе бірнеше болжамды емес, көптеген болжамдарды пайдаланды. Егер сіз сүйікті спорт командаңыз келесі ойында жеңеді деп болжасаңыз және ол жеңсе, сіз міндетті түрде жақсы болжамшы емессіз. Мүмкін сіз әрдайым сүйікті командаңыз жеңеді деп болжайтын шығарсыз: егер бұл сіздің стратегияңыз болса және олар тек жарты уақытта ғана жеңсе, сіздің болжам жасау қабілетіңіз ерекше емес. Кездейсоқтықтың рөлін азайту үшін зерттеушілер қатысушылардың көптеген болжамдар бойынша орташа есеппен қалай жұмыс істегенін тексерді.
Екіншіден, зерттеушілер қатысушылардан болжамдарын «бұл болады» немесе «бұл болмайды» деген екіжақты форматта емес, оқиғаның болу ықтималдығы тұрғысынан жасауды сұрады. Көптеген адамдар үшін болжам жасау соңғысын білдіреді — бір жақты ұстану. Дегенмен, болашақ оқиғалар туралы білместігімізді ескерсек, ықтималдық болжамдарын жасаған әлдеқайда дұрыс. Егер біреу 2016 жылы «Хиллари Клинтонның президент болып сайлану ықтималдығы 70%» десе, ол міндетті түрде нашар болжамшы емес. 70% ықтималдықпен болады деп дұрыс айтылған нәрселер 30% жағдайда болмайды. Болжамшылардың жақсы екенін білу үшін біз олардың ықтималдық бағалауларының шындыққа сәйкестігін сұрауымыз керек. Айталық, Маргарет есімді белгілі бір болжамшы 500 түрлі оқиғаның болу ықтималдығын 60% деп бағалады делік. Егер олардың 300-і шынымен орындалса, онда біз Маргареттің сенімі жақсы калибрленген (calibration - болжам ықтималдығының оқиға жиілігіне сәйкестігі) деп қорытынды жасай аламыз. Жақсы калибрлеу — жақсы болжам жасаудың бір талабы.
Үшіншіден, қосымша нақтылау ретінде Тетлок пен оның әріптестері болжамшылардан оқиғаның, айталық, он екі ай ішінде болатыны туралы тек бір ықтималдық бағасын жасауды ғана сұраған жоқ. Олар қатысушыларға жаңа ақпаратқа сәйкес өз болжамдарын үздіксіз қайта қарауға мүмкіндік берді. Айталық, сіз 2016 жылы Біріккен Корольдіктің 2019 жылдың соңына дейін Еуропалық Одақтан шығу мүмкіндігі тек 30% деп бағаладыңыз делік. Жаңа сауалнамалар шығып, «Шығу» дауысының басымдық алып жатқанын көрсеткенде, сіз болжамыңызды жоғары қарай өзгерткен болар едіңіз. Референдум нәтижесі белгілі болған кезде, Біріккен Корольдіктің сол мерзім ішінде одақтан шығатыны әлі де белгісіз еді, бірақ бұл әлдеқайда ықтимал болып көрінді. (Brexit техникалық түрде 2020 жылы орын алды. )
Әрбір жаңа ақпаратпен Тетлок пен оның әріптестері болжамшыларға болжамдарын жаңартуға рұқсат берді. Ұпай жинау мақсатында осы жаңартулардың әрқайсысы жаңа болжам ретінде қарастырылады. Осылайша, «Жақсы пайымдау» жобасының қатысушылары жаңалықтарды бақылап отыруға және өз ойларын өзгерткені үшін сынға ұшырау қаупіне қарамастан, болжамдарын үздіксіз жаңартып отыруға ынталандырылады. (Бұл сынға жақсы танымал жауап, кейде Джон Мейнард Кейнске телінеді: «Фактілер өзгергенде, мен ойымды өзгертемін. Ал сіз не істейсіз? »)
Төртіншіден, болжамшылардың нәтижелерін бағалау үшін «Жақсы пайымдау» жобасы 1950 жылы Гленн В. Брайер жасаған жүйені пайдаланды. Брайер көрсеткіштері (Brier scores - болжам мен шындық арасындағы алшақтықты өлшеуіш) адамдардың болжағаны мен іс жүзінде болған оқиға арасындағы қашықтықты өлшейді.
Брайер көрсеткіштері — ықтималдық болжамдарымен байланысты кең таралған мәселені айналып өтудің тапқыр жолы: бұл мәселе — болжамшылардың ешқашан батыл позиция ұстанбай, өз бәстерін сақтандыруға (сақтық танытуға) тырысуы. Маргаретті тағы да мысалға алайық, біз оны жақсы калибрленген болжамшы деп атадық, себебі ол 500 оқиғаны 60% ықтималдықпен бағалады және сол оқиғалардың 300-і орындалды. Бұл нәтиже көрінгендей керемет болмауы мүмкін. Егер Маргарет әрдайым жаңбыр жауу ықтималдығын 60% деп болжайтын ауа райы болжамшысы болса және 500 күннің 300-і жаңбырлы болса, Маргареттің болжамдары жақсы калибрленген, бірақ іс жүзінде пайдасыз. Маргарет, негізінде, сізге күн сайын қолшатыр алып жүргеніңіз жөн екенін айтып отыр. Оны Николаспен салыстырыңыз, ол жаңбыр жауатын 300 күнде жаңбырдың жауу ықтималдығын 100%, ал құрғақ 200 күнде 0% деп болжайды. Николастың калибрленуі Маргареттікімен бірдей мінсіз: екі болжамшының қайсысы болса да күндердің X%-ы жаңбырлы болады деп болжағанда, жаңбыр дәл сол X% уақытта жауады. Бірақ Николастың болжамдары әлдеқайда құнды: ол сақтанбай, сізге қолшатыр алу керек пе, жоқ па, соны айтуға дайын. Техникалық тұрғыдан алғанда, Николастың жақсы калибрлеуімен қатар жоғары ажыратымдылығы (resolution - болжамдардың нақтылығы мен батылдығы) бар деп айтылады.
Брайер көрсеткіштері жақсы калибрлеуді де, жақсы ажыратымдылықты да марапаттайды. Жақсы ұпай жинау үшін сіз тек орташа есеппен дұрыс болуыңыз (яғни, жақсы калибрленген) ғана емес, сонымен қатар белгілі бір позиция ұстануға және болжамдарды ажыратуға дайын болуыңыз керек (яғни, жоғары ажыратымдылыққа ие болу). Брайер көрсеткіштері орташа квадраттық қателіктер логикасына негізделген және төмен көрсеткіштер жақсырақ деп саналады: 0 көрсеткіші мінсіз болар еді.
Сонымен, біз олардың қалай бағаланғанын білгеннен кейін, «Жақсы пайымдау» жобасының еріктілері қаншалықты жақсы нәтиже көрсетті? Негізгі тұжырымдардың бірі — еріктілердің басым көпшілігі нашар нәтиже көрсетті, бірақ шамамен 2%-ы ерекшеленді. Жоғарыда айтылғандай, Тетлок бұл жақсы нәтиже көрсеткен адамдарды суперболжамшылар деп атайды. Олар қателеспейтін адамдар емес еді, бірақ олардың болжамдары кездейсоқ болжамдардан әлдеқайда жақсы болды. Бір мемлекеттік қызметкер бұл топтың «құпия деректер мен басқа да мәліметтерді оқи алатын барлау қоғамдастығы талдаушыларының орташа көрсеткішінен айтарлықтай жақсы» жұмыс істегенін айтты. Бұл салыстыруға ерекше тоқталу керек. Барлау қоғамдастығының талдаушылары дәл болжам жасауға дайындалған; олар әуесқойлар емес. Сонымен қатар, олар құпия ақпаратқа қол жеткізе алады. Дегенмен, олар суперболжамшылар сияқты жақсы нәтиже көрсете алмайды.
Тұрақты Бета (Perpetual Beta)
Суперболжаушыларды не соншалықты мықты етеді? 18-тараудағы пайымдауымызға сәйкес, оларды ерекше ақылды деп болжауға болады. Бұл болжам қате емес. GMA тесттерінде (жалпы ақыл-ой қабілетін анықтайтын тесттер) суперболжаушылар «Игі ниетті пайымдау» (Good Judgment Project) жобасының орташа еріктілерінен жоғары нәтиже көрсетеді (ал орташа еріктінің көрсеткіші ұлттық деңгейден айтарлықтай жоғары). Бірақ бұл айырмашылық аса үлкен емес және интеллект тесттерінен өте жоғары балл алған көптеген еріктілер суперболжаушы деңгейіне жете алмайды. Жалпы интеллекттен бөлек, суперболжаушылар сандармен жұмыс істеуге ерекше шебер деп күтуге болады. Шындығында солай. Бірақ олардың басты артықшылығы математикалық талант емес, аналитикалық және ықтималдық тұрғысынан ойлауға (оқиғаның болу мүмкіндігін пайыздармен бағалау) бейімділігінде.
Суперболжаушылардың мәселелерді құрылымдау және бөлшектеу қабілеті мен дайындығын қарастырайық. Олар үлкен геосаяси сұраққа (мемлекет Еуропалық Одақтан шыға ма, белгілі бір жерде соғыс бастала ма, шенеунікке қастандық жасала ма) қатысты біртұтас пайымдау жасаудың орнына, оны құрамдас бөліктерге бөледі. Олар: «Жауап «иә» болуы үшін не қажет? Жауап «жоқ» болуы үшін не қажет? » — деп сұрайды. Ішкі түйсікке немесе жалпылама болжамға сүйенудің орнына, олар бірқатар қосымша сұрақтарға жауап іздеуге тырысады.
Суперболжаушылар сондай-ақ «сыртқы көзқарасты» қолдануға өте шебер және негізгі көрсеткіштерге (оқиғаның жалпы статистикалық жиілігі) үлкен мән береді. 13-тараудағы Гамбарди мәселесінде түсіндірілгендей, Гамбардидің жеке сипаттамасына назар аудармас бұрын, орташа бас директордың алдағы екі жылда жұмыстан шығу немесе босатылу ықтималдығын білу көмектеседі. Суперболжаушылар жүйелі түрде негізгі көрсеткіштерді іздейді. Егер келесі жылы Қытай мен Вьетнам арасында шекаралық дау үшін қарулы қақтығыс бола ма деп сұраса, суперболжаушылар бірден Қытай мен Вьетнамның қазіргі қарым-қатынасына ғана назар аудармайды. Жаңалықтар мен талдауларға сүйене отырып, оларда белгілі бір түйсік болуы мүмкін. Бірақ олар бір оқиғаға қатысты түйсіктің әдетте жақсы бағдар бола алмайтынын біледі. Оның орнына олар негізгі көрсеткішті іздеуден бастайды: олар өткен уақытта шекаралық даулардың қаншалықты жиі қарулы қақтығысқа ұласқанын сұрайды. Егер мұндай қақтығыстар сирек болса, суперболжаушылар алдымен осы фактіні ескереді, содан кейін ғана Қытай-Вьетнам жағдайының егжей-тегжейіне көшеді.
Қысқасы, суперболжаушыларды ерекшелейтін нәрсе тек интеллект емес, оны қалай қолданатынында. Олардың дағдылары 18-тарауда сипатталған, жақсырақ пайымдауларға әкелетін танымдық стильді, әсіресе жоғары деңгейдегі «белсенді ашық ойлылықты» (өз сеніміне қайшы келетін дәлелдерді саналы түрде іздеу) көрсетеді. Белсенді ашық ойлылық тестін еске түсіріңіз: ол «Адамдар өз сенімдеріне қайшы келетін дәлелдерді ескеруі керек» және «Өзіңмен келісетін адамдардан көрі, келіспейтін адамдарға назар аудару пайдалырақ» деген сияқты тұжырымдарды қамтиды. Әлбетте, бұл тесттен жоғары балл алған адамдар жаңа ақпарат пайда болған кезде өз пайымдауларын жаңартудан (артық реакциясыз) қашпайды.
Суперболжаушылардың ойлау стилін сипаттау үшін Тетлок «шексіз бета» (perpetual beta) фразасын қолданады. Бұл терминді компьютерлік бағдарламашылар соңғы нұсқасы шықпайтын, бірақ шексіз қолданылатын, талданатын және жетілдірілетін бағдарламалар үшін пайдаланады. Тетлоктың анықтауынша, «адамның суперболжаушылар қатарына қосылуының ең күшті болжаушысы — оның сенімдерін жаңартуға және өзін-өзі жетілдіруге деген ұмтылыс деңгейі, яғни «шексіз бета» күйі». Ол айтқандай: «Оларды мықты ететін нәрсе — олардың кім екені емес, не істейтіні: зерттеудің ауыр жұмысы, мұқият ойлану мен өзін-өзі сынау, басқа көзқарастарды жинақтау мен синтездеу, егжей-тегжейлі пайымдаулар мен тынымсыз жаңарту». Олар ойлаудың ерекше циклін ұнатады: «көру, сәтсіздікке ұшырау, талдау, түзету, қайта көру».
Болжаудағы шу мен ауытқу
Осы тұста сізде адамдарды суперболжаушы болуға немесе кем дегенде солар сияқты әрекет етуге үйретуге болады деген ой туындауы мүмкін. Шынында да, Тетлок пен оның әріптестері дәл осы бағытта жұмыс істеді. Олардың күш-жігерін суперболжаушылардың неге жақсы нәтиже көрсететінін түсінудің және олардың жұмысын қалай жақсартуға болатынын білудің екінші кезеңі деп қарастыру керек.
Маңызды зерттеуде Тетлок пен оның командасы қарапайым (супер емес) болжаушыларды кездейсоқ түрде үш топқа бөлді, онда олар әртүрлі интервенциялардың кейінгі пайымдаулардың сапасына әсерін тексерді. Бұл интервенциялар пайымдауды жақсарту үшін біз сипаттаған үш стратегияның мысалы болып табылады:
Оқыту: Бірнеше болжаушы ықтималдық ойлауды үйрету арқылы олардың қабілеттерін арттыруға арналған оқулықты аяқтады. Оқулықта болжаушылар әртүрлі ауытқулар (соның ішінде негізгі көрсеткішті елемеу, өзіне артық сенімділік және растау ауытқуы), әртүрлі дереккөздерден алынған көптеген болжамдарды орташалаудың маңыздылығы және референттік кластарды ескеру туралы білді. Команда құру (агрегацияның бір түрі): Кейбір болжаушылардан командаларда жұмыс істеу сұралды, онда олар бір-бірінің болжамдарын көріп, талқылай алды. Командалық жұмыс болжаушыларды қарсы аргументтермен жұмыс істеуге және белсенді ашық ойлы болуға ынталандыру арқылы дәлдікті арттыруы мүмкін. Іріктеу: Барлық болжаушылардың дәлдігі бағаланды және толық жылдың соңында үздік 2% суперболжаушылар деп танылып, келесі жылы элиталық командаларда бірге жұмыс істеу мүмкіндігіне ие болды.
Нәтижесінде, үш интервенция да адамдардың Брайер көрсеткіштерін (болжамдардың дәлдігін өлшейтін статистикалық көрсеткіш) жақсарту тұрғысынан тиімді болды. Оқыту өзгеріс әкелді, командалық жұмыс одан да үлкен әсер етті, ал іріктеу ең үлкен нәтиже берді.
Бұл маңызды тұжырым пайымдауларды біріктірудің және жақсы төрешілерді таңдаудың құндылығын растайды. Бірақ бұл әлі толық тарих емес. Әрбір интервенцияның әсері туралы деректермен қаруланған, Тетлок және Меллерспен бірге жұмыс істеген Вилле Сатопя әрбір интервенцияның болжамдарды нақты қалай жақсартқанын анықтау үшін күрделі статистикалық әдісті жасап шығарды. Негізінде, ол кейбір болжаушылардың басқаларға қарағанда жақсы немесе нашар жұмыс істеуінің үш негізгі себебі бар деп тұжырымдады:
Олар өздері жасауы керек болжамға қатысты ортадағы деректерді табуға және талдауға көбірек дағдыланған болуы мүмкін. Бұл түсіндірме ақпараттың маңыздылығын көрсетеді. Кейбір болжаушылардың болжамның шынайы мәнінен белгілі бір жаққа қарай жүйелі түрде қателесу тенденциясы болуы мүмкін. Егер сіз жүздеген болжамның ішінде статус-кводан болатын белгілі бір өзгерістердің ықтималдығын жүйелі түрде асыра немесе кем бағаласаңыз, сіз өзгерісті немесе тұрақтылықты қолдайтын ауытқудан (bias) зардап шегесіз деп айтуға болады. Кейбір болжаушылар шуға (немесе кездейсоқ қателерге) азырақ бейім болуы мүмкін. Болжам жасауда, кез келген пайымдаудағыдай, шудың көптеген себептері болуы мүмкін. Болжаушылар белгілі бір жаңалыққа тым қатты реакция беруі мүмкін (бұл біз «үлгі шуы» деп атаған нәрсенің мысалы), оларға жағдайлық шу әсер етуі мүмкін немесе олар ықтималдық шкаласын қолдануда тұрақсыз болуы мүмкін. Бұл қателердің барлығының (және тағы басқалардың) көлемі мен бағытын алдын ала болжау мүмкін емес.
Сатопя, Тетлок, Меллерс және олардың әріптесі Марат Салихов өз моделін болжауға арналған BIN (bias — ауытқу, information — ақпарат және noise — шу) моделі деп атады. Олар үш компоненттің әрқайсысы үш интервенцияның әрқайсысындағы өнімділіктің жақсаруына қаншалықты жауапты екенін өлшеуге кірісті.
Олардың жауабы қарапайым болды: үш интервенция да бірінші кезекте шуды азайту арқылы жұмыс істеді. Зерттеушілер айтқандай: «Интервенция дәлдікті арттырған сайын, ол негізінен пайымдаудағы кездейсоқ қателерді басу арқылы жұмыс істеді. Бір қызығы, оқыту интервенциясының бастапқы мақсаты ауытқуды азайту болатын».
Оқыту ауытқуларды азайтуға арналғандықтан, супер емес болжаушы оқытудың негізгі әсері ауытқуды азайту болады деп болжаған болар еді. Дегенмен, оқыту шуды азайту арқылы нәтиже берді. Бұл тосынсыйды оңай түсіндіруге болады. Тетлоктың оқытуы психологиялық ауытқулармен күресуге арналған. Сіз білетіндей, психологиялық ауытқулардың әсері әрқашан статистикалық ауытқу бола бермейді. Олар әртүрлі адамдарға, әртүрлі пайымдауларға, әртүрлі жолдармен әсер еткенде, психологиялық ауытқулар шу тудырады. Бұл жағдайда солай екені анық, өйткені болжанатын оқиғалар өте әртүрлі. Сонымен қатар, бір ауытқулар тақырыпқа байланысты болжаушыны тым қатты немесе тым әлсіз реакция беруге итермелеуі мүмкін. Біз олардың статистикалық ауытқу (болжаушының оқиғалар болады немесе болмайды деп сенуге деген жалпы бейімділігі) тудыруын күтпеуіміз керек. Нәтижесінде, болжаушыларды психологиялық ауытқулармен күресуге үйрету шуды азайту арқылы жұмыс істейді.
Команда құру шуды азайтуға шамалас әсер етті, бірақ ол командалардың ақпаратты алу қабілетін де айтарлықтай жақсартты. Бұл нәтиже агрегация логикасына сәйкес келеді: бірге жұмыс істейтін бірнеше ми ақпаратты табуда бір мидан жақсырақ. Егер Алиса мен Брайан бірге жұмыс істесе және Алиса Брайан өткізіп алған сигналдарды байқаса, олардың бірлескен болжамы жақсырақ болады. Топтарда жұмыс істегенде, суперболжаушылар топтық поляризация мен ақпараттық каскадтардың қаупінен аулақ бола алатын сияқты. Оның орнына олар өз деректері мен түсініктерін біріктіреді және өздерінің белсенді ашық ойлылығымен біріктірілген ақпаратты барынша тиімді пайдаланады. Сатопя мен оның әріптестері бұл артықшылықты былай түсіндіреді: «Команда құру — оқытудан айырмашылығы... болжаушыларға ақпаратты тізгіндеуге мүмкіндік береді».
Іріктеу ең үлкен жалпы әсерге ие болды. Жақсартудың бір бөлігі ақпаратты жақсырақ пайдаланудан келеді. Суперболжаушылар ақпаратты табуда басқалардан жақсырақ — бәлкім, олар орташа қатысушыға қарағанда ақылдырақ, ынталырақ және мұндай болжамдар жасауда тәжірибелірек болғандықтан болар. Бірақ іріктеудің негізгі әсері, тағы да, шуды азайту болып табылады. Суперболжаушылар қарапайым ойыншыларға немесе тіпті дайындалған командаларға қарағанда азырақ шулы. Бұл тұжырым Сатопя мен басқа зерттеушілер үшін де күтпеген жағдай болды: «Суперболжаушылар өз жетістіктері үшін басқалар қайталай алмайтын жаңалықтарды өткір түсінуден гөрі, өлшеу қатесін азайтудағы жоғары тәртіпке көбірек қарыздар болуы мүмкін».
Іріктеу мен агрегация қай жерде тиімді
Суперболжаушылар жобасының жетістігі шешім гигиенасының екі стратегиясының құндылығын көрсетеді: іріктеу (суперболжаушылар, шынымен де, супер) және агрегация (командада жұмыс істегенде болжаушылар жақсырақ нәтиже көрсетеді). Бұл екі стратегия көптеген пайымдауларда кеңінен қолданылады. Мүмкіндігінше, өз ісінің маманы болып табылатын және бір-бірін толықтыратын төрешілерден (мысалы, болжаушылар, инвестиция мамандары, рекрутинг офицерлері) командалар құру арқылы осы стратегияларды біріктіруге тырысу керек.
Осы уақытқа дейін біз «көпшілік даналығы» эксперименттеріндегідей, бірнеше тәуелсіз пайымдауларды орташалау арқылы қол жеткізілетін дәлдіктің жақсаруын қарастырдық. Жоғары валидтілігі бар төрешілердің бағалауларын біріктіру дәлдікті одан әрі арттырады. Сонымен қатар, тәуелсіз және бірін-бірі толықтыратын пайымдауларды біріктіру арқылы дәлдікті тағы да арттыруға болады. Қылмыстың төрт куәгері бар деп елестетіңіз: олардың бір-біріне әсер етпеуін қадағалау өте маңызды. Егер бұған қоса, олар қылмысты төрт түрлі бұрыштан көрген болса, олар беретін ақпараттың сапасы әлдеқайда жақсы болады.
Бірлесіп пайымдау жасау үшін кәсіби мамандар командасын жинақтау мектептегі немесе жұмыстағы үміткерлердің болашақ үлгерімін болжау үшін тесттер жиынтығын құрастыруға ұқсайды. Бұл тапсырманың стандартты құралы — көптік регрессия (айнымалылар арасындағы байланысты талдайтын статистикалық әдіс). Ол айнымалыларды кезекпен таңдау арқылы жұмыс істейді. Нәтижені ең жақсы болжайтын тест бірінші таңдалады. Дегенмен, келесі қосылатын тест міндетті түрде екінші ең жарамды тест болуы шарт емес. Оның орнына, ол бірінші тестке ең көп болжамдық күш қосатын, яғни біріншісімен қайталанбайтын әрі жарамды болжамдар беретін тест болуы керек. Мысалы, сізде болашақ өнімділікпен 0,50 және 0,45 корреляция жасайтын екі ақыл-ой қабілеті тесті және өнімділікпен тек 0,30 корреляция жасайтын, бірақ қабілет тесттерімен байланысы жоқ тұлғалық тест бар делік. Оңтайлы шешім — алдымен ең жарамды қабілет тестін, содан кейін жаңа ақпарат әкелетін тұлғалық тестті таңдау.
Сол сияқты, егер сіз төрешілер командасын жинақтап жатсаңыз, әрине, алдымен ең жақсы төрешіні таңдауыңыз керек. Бірақ келесі таңдауыңыз бірінші төрешіге өте ұқсас келетін білікті маман емес, жаңа дағды әкелетін орташа білікті адам болуы мүмкін. Осылайша таңдалған команда жоғары болады, себебі біріктірілген пайымдаулардың дәлдігі пайымдаулар бір-бірін қайталағаннан көрі, бір-бірімен байланыссыз болғанда тезірек артады. Мұндай командада үлгі шуы салыстырмалы түрде жоғары болады, өйткені әрбір жағдай бойынша жеке пайымдаулар әртүрлі болады. Парадоксальды түрде, сол шулы топтың орташа мәні бірауызды топтың орташа мәнінен дәлірек болады.
Маңызды ескерту жасау керек. Әртүрлілікке қарамастан, агрегация тек пайымдаулар шынымен тәуелсіз болған жағдайда ғана шуды азайта алады. Топтардағы шу туралы талқылауымыз көрсеткендей, топтық талқылау көбінесе шуды азайтқаннан көрі, ауытқу түріндегі қателікті көбірек қосады. Әртүрліліктің күшін пайдаланғысы келетін ұйымдар команда мүшелері өз пайымдауларына тәуелсіз жеткенде туындайтын келіспеушіліктерді құп алуы керек. Тәуелсіз және әртүрлі пайымдауларды анықтау және біріктіру көбінесе ең оңай, ең арзан және кеңінен қолданылатын шешім гигиенасы стратегиясы болады.
Іріктеу және агрегация туралы айтқанда
«Төрт тәуелсіз пайымдаудың орташа мәнін алайық — бұл шуды екі есе азайтуға кепілдік береді».
«Біз суперболжаушылар сияқты «шексіз бета» күйінде болуға ұмтылуымыз керек».
«Бұл жағдайды талқыламас бұрын, тиісті негізгі көрсеткіш (base rate) қандай? »
«Бізде жақсы команда бар, бірақ пікірлердің әртүрлілігін қалай қамтамасыз ете аламыз? » [/QUOTE]
22-ТАРАУ Медицинадағы нұсқаулықтар
Бірнеше жыл бұрын біздің жақсы досымызға (оны Пауыл деп атайық) оның учаскелік дәрігері (оны доктор Джонс деп атайық) жоғары қан қысымы диагнозын қойды. Дәрігер Пауылға дәрі-дәрмек ішуге кеңес берді. Доктор Джонс диуретик жазып берді, бірақ оның ешқандай әсері болмады; Пауылдың қан қысымы жоғары болып қалды. Бірнеше аптадан кейін доктор Джонс екінші дәрімен, кальций өзекшелерінің блокаторымен жауап берді. Оның да әсері шамалы болды.
Бұл нәтижелер доктор Джонсты тығырыққа тіреді. Үш ай бойы апта сайынғы тексерулерден кейін Пауылдың жоғары қан қысымы көрсеткіштері сәл төмендеді, бірақ олар әлі де тым жоғары болды. Келесі қадамдардың қандай болатыны белгісіз еді. Пауыл мазасызданды, ал доктор Джонс қиналды, әсіресе Пауылдың денсаулығы жақсы, салыстырмалы түрде жас адам екенін ескерсек. Доктор Джонс үшінші дәріні қолданып көруді ойлады.
Сол сәтте Пауыл жаңа қалаға көшіп, онда жаңа учаскелік дәрігерге (оны доктор Смит деп атайық) жүгінді. Пауыл доктор Смитке жоғары қан қысымымен жалғасып жатқан күресі туралы айтып берді. Доктор Смит бірден: «Үйде қан қысымын өлшейтін аппарат сатып алыңыз және көрсеткіштердің қандай екенін көріңіз. Меніңше, сізде мүлдем жоғары қан қысымы жоқ. Сізде, сірә, ақ халат синдромы (дәрігердің алдында қан қысымының көтерілуі) бар — дәрігер кабинетінде қан қысымыңыз көтеріліп кетеді! » — деп жауап берді.
Пауыл айтылғанды орындады және шынымен де оның қан қысымы үйде қалыпты болды. Содан бері ол қалыпты болып келеді (және доктор Смит оған ақ халат синдромы туралы айтқаннан кейін бір ай өткен соң, ол дәрігер кабинеттерінде де қалыпты болды).
Дәрігерлердің негізгі міндеті — диагноз қою, яғни емделушінің қандай да бір ауруы бар-жоғын анықтау және егер болса, оны сәйкестендіру. Диагноз қою көбінесе пайымдауды талап етеді. Көптеген жағдайлар үшін диагноз қою күнделікті және негізінен механикалық процесс болып табылады, шуды азайту үшін ережелер мен процедуралар бар. Дәрігерге біреудің иығы шығып кеткенін немесе бақайы сынғанын анықтау әдетте оңай. Техникалық мәселелер туралы да осыны айтуға болады. Сіңір дегенерациясын сандық бағалау аз шу тудырады. Патологтар сүт безі зақымдануларының биопсиясын бағалағанда, олардың бағалаулары салыстырмалы түрде қарапайым және шу аз болады.
Маңыздысы, кейбір диагноздар пайымдауды мүлдем талап етпейді. Денсаулық сақтау саласы көбінесе пайымдау элементін алып тастау арқылы — пайымдаудан есептеуге ауысу арқылы дамиды. Стрептококкты тамақ ауруы үшін дәрігер емделушінің тамағынан алынған үлгіге жылдам антигендік тест жасаудан бастайды. Қысқа уақыт ішінде тест стрептококк бактерияларын анықтай алады. (Жылдам антиген тестінің нәтижесінсіз, тіпті белгілі бір дәрежеде онымен бірге де, стрептококкты тамақ ауруы диагнозында шу болады. ) Егер сізде аш қарынға қандағы қант деңгейі децилитріне 126 миллиграмм немесе одан жоғары болса немесе HbA1c (соңғы үш айдағы қандағы қанттың орташа өлшемі) кемінде 6,5 болса, сізде диабет бар деп есептеледі. COVID-19 пандемиясының алғашқы кезеңдерінде кейбір дәрігерлер бастапқыда симптомдарды ескере отырып жасалған пайымдаулар нәтижесінде диагноз қойды; пандемия дамыған сайын тест жасау әлдеқайда жиілеп, тесттер пайымдауды қажетсіз етті.
Көптеген адамдар дәрігерлер пайымдау жасағанда шулы болуы мүмкін екенін және қателесуі мүмкін екенін біледі; стандартты практика емделушілерге екінші маманның пікірін алуға кеңес беру болып табылады. Кейбір ауруханаларда екінші пікір алу тіпті міндетті. Екінші пікір біріншіден алшақтаған сайын, бізде шу пайда болады — әрине, қай дәрігердің пікірі дұрыс екені белгісіз болуы мүмкін. Кейбір емделушілер (соның ішінде Пауыл да) екінші пікірдің біріншіден қаншалықты алшақтайтынын көріп таң қалды. Бірақ таңқаларлық нәрсе медицина мамандарында шудың болуы емес. Бұл оның нақты ауқымы.
Бұл тараудағы біздің мақсатымыз — осы тұжырымды егжей-тегжейлі түсіндіру және медицина мамандары шуды азайту үшін қолданатын кейбір тәсілдерді сипаттау. Біз шешім гигиенасының бір стратегиясына тоқталамыз: диагностикалық нұсқаулықтарды әзірлеу. Біз медицинадағы шу және дәрігерлердің, мейірбикелердің және ауруханалардың оны жою үшін жасап жатқан әртүрлі қадамдары туралы тұтас бір кітап жазуға болатынын жақсы түсінеміз. Атап айтқанда, медицинадағы шу тек біздің назарымыздағы диагностикалық пайымдаулардағы шумен шектелмейді. Емдеу әдістері де шулы болуы мүмкін және бұл тақырыпқа да кең ауқымды әдебиеттер арналған. Егер емделушіде жүрек ақауы болса, дәрігерлердің ең жақсы емдеу туралы пайымдаулары (тиісті дәрі-дәрмек, ота түрі немесе мүлдем ота жасау қажеттілігі туралы болсын) таңқаларлықтай құбылмалы. Дартмут атлас жобасы (Dartmouth Atlas Project) жиырма жылдан астам уақыт бойы «АҚШ-та медициналық ресурстардың қалай бөлінетіні мен қолданылатынындағы айқын ауытқуларды» құжаттауға арналған. Осындай қорытындылар көптеген елдерге де қатысты. Біздің мақсатымыз үшін диагностикалық пайымдаулардағы шуды қысқаша зерттеу жеткілікті болады.
Көкжиекке шолу
Медицинадағы шу туралы орасан зор әдебиет бар. Әдебиеттердің көп бөлігі эмпирикалық болғанымен (шудың бар-жоғын тексеру), оның көп бөлігі де нұсқаулық сипатта болады. Денсаулық сақтау саласына қатысы бар адамдар көптеген формаларды алатын және көптеген салаларда қарастыруға тұрарлық идеялардың алтын кеніші болып табылатын шуды азайту стратегияларын іздеуді жалғастыруда.
Шу болған кезде бір дәрігер анық дұрыс, ал екіншісі анық қате болуы мүмкін (және қандай да бір ауытқудан зардап шегуі мүмкін). Күткеніміздей, шеберлік үлкен рөл атқарады. Мысалы, радиологтардың пневмония диагнозын қоюын зерттеу айтарлықтай шу тапты. Оның көп бөлігі шеберліктегі айырмашылықтардан туындаған. Нақтырақ айтсақ, «шеберліктегі ауытқу диагностикалық шешімдердегі ауытқудың 44%-ын түсіндіре алады», бұл «шеберлікті арттыратын саясат біркелкі шешім нұсқаулықтарына қарағанда жақсырақ нәтиже беретінін» көрсетеді. Мұнда да, басқа жерлердегідей, оқыту мен іріктеу қателерді азайту үшін, сондай-ақ шу мен ауытқуды жою үшін өте маңызды.
Радиология және патология сияқты кейбір мамандықтарда дәрігерлер шудың бар екенін жақсы біледі. Мысалы, радиологтар диагностикалық ауытқуларды өздерінің «Ахиллес өкшесі» (ең әлсіз тұсы) деп атайды. Радиология мен патология салаларындағы шуға ерекше көңіл бөлінуі бұл салаларда шудың басқаларға қарағанда шынымен көптігінен бе, әлде шуды құжаттау оңай болғандықтан ба, ол жағы белгісіз. Біз құжаттаудың оңайлығы маңыздырақ болуы мүмкін деп ойлаймыз. Радиологияда шуды (кейде қатені де) тексерудің таза әрі қарапайым сынақтарын өткізу оңайырақ. Мысалы, алдыңғы бағалауды қайта қарау үшін сканерлеу нәтижелеріне немесе слайдтарға қайта оралуға болады.
Медицинада адамдар арасындағы шу немесе <span data-term="true">бағалаушылар арасындағы сенімділік</span> (бірнеше маманның қорытындыларының сәйкестігі) әдетте <span data-term="true">каппа статистикасымен</span> (статистикалық келісім өлшемі) өлшенеді.
Каппа неғұрлым жоғары болса, шу соғұрлым аз болады. Каппа мәні 1-ге тең болса, бұл толық келісімді білдіреді; 0 мәні диагноздар тізіміне дартс лақтырған маймылдардың арасындағы сәйкестікпен бірдей деңгейді көрсетеді. Медициналық диагностиканың кейбір салаларында осы коэффициентпен өлшенген сенімділік «төмен» немесе «нашар» деп табылды, бұл шудың өте жоғары екенін білдіреді. Көбінесе ол «қанағаттанарлық» деп табылады, бұл әрине жақсырақ, бірақ сонымен бірге айтарлықтай шудың бар екенін көрсетеді. Қай дәрілік өзара әрекеттесулер клиникалық тұрғыдан маңызды деген маңызды сұрақ бойынша, кездейсоқ таңдалған жүз өзара әрекеттесуді қарап шыққан жалпы практика дәрігерлері «нашар келісім» көрсетті. Сртқы бақылаушыларға және көптеген дәрігерлерге бүйрек ауруының әртүрлі кезеңдерін диагностикалау салыстырмалы түрде оңай көрінуі мүмкін. Бірақ нефрологтар (бүйрек ауруларын емдейтін мамандар) бүйрек ауруы бар емделушілерді бағалауда қолданылатын стандартты тесттердің мағынасы туралы шешімдерінде тек «төмен және орташа келісім» көрсетеді.
Сүт безі зақымдануының қатерлі ісік екендігі туралы сұрақ бойынша бір зерттеу патологтар арасында тек «қанағаттанарлық» келісім тапты. Сүт безінің пролиферативті зақымдануларын диагностикалауда келісім тағы да тек «қанағаттанарлық» болды. Дәрігерлер жұлын стенозының дәрежесін анықтау үшін МРТ сканерлеуін бағалағанда да келісім «қанағаттанарлық» болды. Бұл нәтижелерге тоқталып өткен жөн. Біз медицинаның кейбір салаларында шу деңгейі өте төмен екенін айттық. Бірақ айтарлықтай техникалық болып табылатын кейбір салаларда дәрігерлер шудан мүлдем ада емес. Емделушіге қатерлі ісік сияқты ауыр ауру диагнозының қойылуы оның қай дәрігерге қаралатынына байланысты лотереяның бір түріне айналуы мүмкін.
Шу деңгейі ерекше назар аударарлық салалардан алынған әдебиеттердегі тағы бірнеше нәтижелерді қарастырайық. Біз бұл тұжырымдарды үнемі дамып және жетіліп жатқан (кейбір жағдайларда қарқынды түрде) медициналық практиканың қазіргі жай-күйі туралы беделді мәлімдеме жасау үшін емес, жақын өткенде де, қазіргі уақытта да шудың қаншалықты кең таралғаны туралы жалпы түсінік беру үшін сипаттаймыз.
Жүрек ауруы Америка Құрама Штаттарында ерлер мен әйелдер арасындағы өлім-жітімнің басты себебі болып табылады. Жүрек ауруын тексерудің негізгі әдісі болып табылатын коронарлық ангиограммалар (қан тамырларын рентгендік зерттеу) жедел және жедел емес жағдайларда жүрек артерияларының бітелу дәрежесін бағалайды. Жедел емес жағдайларда, емделуші кеуде тұсындағы қайталанбалы ауырсынумен келгенде, бір немесе бірнеше артерияның 70%-дан астамы бітелгені анықталса, көбінесе емдеу — мысалы, стенттеу (тамырды кеңейту үшін арнайы тор орнату) жүргізіледі. Дегенмен, ангиограммаларды түсіндірудегі ауытқулар құжатталған, бұл қажетсіз процедураларға әкелуі мүмкін. Ерте жүргізілген зерттеулердің бірі ангиограммаларды бағалайтын дәрігерлердің 31% жағдайда негізгі тамырдың 70%-дан астам бітелген-бітелмегені туралы келіспейтінін анықтады. Кардиологтардың ангиограммаларды оқудағы ықтимал ауытқулар туралы кеңінен хабардар болуына және үздіксіз күш-жігер мен түзету шараларына қарамастан, бұл мәселе әлі шешілген жоқ. Эндометриоз — бұл әдетте жатырдың ішкі қабатын түзетін эндометриялық тіннің жатырдан тыс өсуімен сипатталатын бұзылыс. Бұл бұзылыс ауырсынуды тудыруы және бедеулік мәселелеріне әкелуі мүмкін. Ол көбінесе лапароскопия (іш қуысын шағын тесік арқылы камерамен тексеру) арқылы анықталады. Үш емделушінің (екеуінде әртүрлі дәрежедегі эндометриоз бар, біреуінде жоқ) лапароскопиясының цифрлық бейнежазбалары 108 гинеколог-хирургқа көрсетілді. Хирургтардан эндометриозды ошақтардың саны мен орналасқан жерін бағалау сұралды. Олардың пікірлері күрт алшақтап, саны мен орналасуы бойынша корреляция әлсіз болды. Туберкулез (ТБ) — бүкіл әлемде ең кең таралған және қауіпті аурулардың бірі; тек 2016 жылдың өзінде ол 10 миллионнан астам адамға жұғып, 2 миллионға жуық адамның өмірін қиды. ТБ анықтаудың кеңінен қолданылатын әдісі — кеуде қуысының рентгені, ол ТБ бактериялары тудырған өкпедегі бос орындарды тексеруге мүмкіндік береді. ТБ диагностикасындағы ауытқулар жетпіс бес жылға жуық уақыт бойы жақсы құжатталған. Ондаған жылдар ішіндегі жақсартуларға қарамастан, зерттеулер ТБ диагностикасында «орташа» немесе жай ғана «қанағаттанарлық» бағалаушылар арасындағы келісіммен айтарлықтай ауытқуларды табуды жалғастыруда. Сондай-ақ әртүрлі елдердегі радиологтар арасында ТБ диагноздарында ауытқулар бар. Патологтар тері зақымдануларын меланоманың — тері қатерлі ісігінің ең қауіпті түрі — бар-жоғына талдағанда, тек «орташа» келісім болды. Әрбір жағдайды қарастырған сегіз патолог тек 62% жағдайда ғана бірауыздан келісті немесе тек бір келіспеушілік көрсетті. Онкологиялық орталықта жүргізілген тағы бір зерттеу меланомалардың диагностикалық дәлдігі небәрі 64% екенін анықтады, бұл дәрігерлер әрбір үшінші зақымдануда меланома диагнозын қате қоятынын білдіреді. Үшінші зерттеу Нью-Йорк университетінің дерматологтары тері биопсиясынан меланоманы 36% жағдайда анықтай алмағанын тапты. Зерттеу авторлары «меланоманы дұрыс диагностикалаудағы клиникалық сәтсіздік осы қауіпті аурумен ауыратын емделушілердің аман қалуына ауыр зардаптарын тигізеді» деген қорытындыға келеді. Скринингтік маммограммалардан сүт безі қатерлі ісігіне қатысты радиологтардың пайымдауларында ауытқулар бар. Үлкен зерттеу әртүрлі радиологтар арасындағы жалған теріс нәтижелердің диапазоны 0%-дан (радиолог әр уақытта дұрыс айтты) 50%-дан жоғарыға дейін (радиолог жағдайлардың жартысынан көбінде маммограмманы қате түрде қалыпты деп анықтады) өзгеретінін анықтады. Сол сияқты, жалған оң нәтижелердің көрсеткіштері 1%-дан аз мәннен 64%-ға дейін ауытқыды (яғни, үш жағдайдың екеуінде радиолог қатерлі ісік болмаған кезде маммограмма қатерлі ісікті көрсетті деп айтты). Әртүрлі радиологтардың жалған теріс және жалған оң нәтижелері шудың бар екеніне кепілдік береді.
Адамдар арасындағы шудың бұл жағдайлары қолданыстағы зерттеулерде басым, бірақ жағдайлық шу туралы да тұжырымдар бар. Радиологтар кейде сол суретті қайта бағалағанда басқа пікір білдіреді және осылайша өздерімен келіспейді (бірақ бұл басқалармен келіспеушілікке қарағанда сирегірек болады). Ангиограммалардағы бітелу дәрежесін бағалау кезінде жиырма екі дәрігер 63-тен 92% жағдайда өздерімен келіспей қалған. Түсініксіз критерийлер мен күрделі пайымдауларды қамтитын салаларда бағалаушының өз-өзімен келісімі (бір маманның әртүрлі уақыттағы шешімдерінің бірізділігі) нашар болуы мүмкін.
Бұл зерттеулер бұл жағдайлық шу туралы нақты түсініктеме бермейді. Бірақ диагностикаға қатысы жоқ басқа зерттеу медицинадағы жағдайлық шудың қарапайым көзін анықтайды — бұл емделушілер үшін де, дәрігерлер үшін де ескеруге тұрарлық тұжырым. Қысқасы, дәрігерлер қатерлі ісік скринингін түстен кейінгі уақытқа қарағанда таңертең ерте тағайындауға әлдеқайда бейім. Үлкен іріктеуде сүт безі және тоқ ішек скринингтік тесттеріне тапсырыс беру деңгейі таңғы сағат 8-де ең жоғары болып, 63,7%-ды құрады. Олар таңертең бойы төмендеп, таңғы сағат 11-де 48,7%-ға дейін жетті. Түскі сағат 12-де олар 56,2%-ға дейін көтеріліп, содан кейін кешкі сағат 5-те 47,8%-ға дейін төмендеді. Осыдан шығатыны, күндізгі уақытқа жазылған емделушілердің нұсқаулықта ұсынылған қатерлі ісік скринингін алу ықтималдығы аз болды.
Мұндай тұжырымдарды қалай түсіндіруге болады? Ықтимал жауап — дәрігерлер әдеттегі жиырма минуттық уақыттан көп уақытты қажет ететін күрделі медициналық мәселелері бар емделушілерді қабылдағаннан кейін клиникада кестеден қалып қояды. Біз стресс пен шаршаудың жағдайлық шуды қоздырушы факторлар ретіндегі рөлін атап өткен болатынбыз (7-тарауды қараңыз), бұл элементтер осы жерде жұмыс істеп тұрған сияқты. Кестеге ілесу үшін кейбір дәрігерлер профилактикалық денсаулық шаралары туралы талқылауларды өткізіп жібереді. Клиницистер арасындағы шаршау рөлінің тағы бір көрінісі — аурухана ауысымдарының аяғында қолды тиісті түрде жуу деңгейінің төмендеуі. (Қол жуу да шулы болып шықты. )
Шу деңгейі төменірек дәрігерлер: Нұсқаулықтардың құндылығы
Әртүрлі медициналық мәселелер контекстінде шудың бар-жоғы мен ауқымы туралы толық есеп беру тек медицинаға ғана емес, сонымен бірге адамзат біліміне де үлкен үлес болар еді. Біз мұндай есептен хабардар емеспіз; уақыт өте келе оның жасалатынына сенеміз. Бірақ қазірдің өзінде қолданыстағы тұжырымдар кейбір тұспалдар береді.
Бір жағынан, кейбір мәселелер мен ауруларды диагностикалау негізінен механикалық болып табылады және пайымдауға орын қалдырмайды. Басқа жағдайларда диагноз механикалық емес, бірақ қарапайым; медициналық дайындығы бар кез келген адам бірдей қорытындыға келуі әбден мүмкін. Тағы басқа жағдайларда, мысалы, өкпе қатерлі ісігі мамандары арасындағы белгілі бір мамандану дәрежесі шудың бар болуын, бірақ минималды болуын қамтамасыз етуге жеткілікті болады. Екінші жағынан, кейбір жағдайлар пайымдауға үлкен мүмкіндік береді және диагностиканың тиісті критерийлері соншалықты ашық болғандықтан, шу айтарлықтай болады және оны азайту қиынға соғады. Кейінірек көретініміздей, психиатрияның көп бөлігінде жағдай осындай.
Медицинадағы шуды азайту үшін не көмектесуі мүмкін? Біз атап өткендей, оқыту дағдыны арттыра алады, ал дағды әрине көмектеседі. Сондай-ақ бірнеше сараптамалық пайымдаулардың агрегациясы (екінші пікір және т. б. ) көмектеседі. Алгоритмдер ерекше перспективалы бағытты ұсынады және дәрігерлер қазір шуды азайту үшін терең оқыту алгоритмдері мен жасанды интеллектті қолдануда. Мысалы, мұндай алгоритмдер сүт безі қатерлі ісігі бар әйелдердегі лимфа түйіндерінің метастаздарын анықтау үшін қолданылды. Олардың ішіндегі ең үздіктері ең үздік патологтан жоғары екені анықталды және әрине алгоритмдер шулы емес. Терең оқыту алгоритмдері қант диабетімен байланысты көз ауруларын анықтау үшін де айтарлықтай табыспен қолданылды. Ал ЖИ қазір маммограммалардан қатерлі ісікті анықтауда кем дегенде радиологтар сияқты жақсы нәтиже көрсетеді; ЖИ-дің одан әрі дамуы оның артықшылығын дәлелдейтін болады.
Медицина мамандығы болашақта алгоритмдерге көбірек сенетін болады; олар ауытқу мен шуды азайтуға және осы процесте өмір мен ақшаны сақтауға уәде береді. Бірақ біз мұнда адам пайымдауының нұсқаулықтарына баса назар аударамыз, өйткені медицина саласы олардың кейбір қолданбаларда қалай жақсы немесе тіпті тамаша нәтижелер беретінін, ал басқаларында аралас нәтижелер көрсететінін жақсы бейнелейді.
Диагностикаға арналған нұсқаулықтың ең танымал мысалы — 1952 жылы акушер-анестезиолог Вирджиния Апгар жасаған Апгар шкаласы. Жаңа туған нәрестенің жағдайы нашар екенін бағалау бұрын дәрігерлер мен акушерлер үшін клиникалық пайымдау мәселесі болатын. Апгар шкаласы оларға стандартты нұсқаулық берді. Бағалаушы нәрестенің тері түсін, жүрек соғу жиілігін, рефлекстерін, бұлшықет тонусын және тыныс алу күшін өлшейді, бұл кейде Апгар есіміне арналған бэкроним (дайын сөзден құрастырылған аббревиатура) ретінде жинақталады: appearance (тері түсі), pulse (жүрек соғу жиілігі), grimace (рефлекстер), activity (бұлшықет тонусы) және respiration (тыныс алу жиілігі мен күші). Апгар тестінде осы бес өлшемнің әрқайсысына 0, 1 немесе 2 ұпай беріледі. Мүмкін болатын ең жоғары жалпы балл — 10, бұл сирек кездеседі. 7 немесе одан жоғары балл денсаулықтың жақсы екенін білдіреді (3-кесте).
Кесте 3: Апгар бағалау нұсқаулығы
| Санат | Берілетін ұпай саны | | :--- | :--- | | **Appearance** (тері түсі) | 0: Бүкіл денесі көк немесе бозғылт
1: Дене түсі жақсы, бірақ қолдары немесе аяқтары көк
2: Толық қызғылт немесе қалыпты түс | | **Pulse** (жүрек соғу жиілігі) | 0: Жүрек соғысы жоқ
1: минутына <100 соққы
2: минутына >100 соққы | | **Grimace** (рефлекстер) | 0: Тыныс алу жолдарының тітіркенуіне жауап жоқ
1: Тітіркену кезіндегі гримаса (бет жиыру)
2: Тітіркену кезіндегі гримаса және жөтел немесе түшкіру | | **Activity** (бұлшықет тонусы) | 0: Босаңсыған, әлсіз
1: Қолдар мен аяқтардың кейбір бүгілуі
2: Белсенді қозғалыс | | **Respiration** (тыныс алу жиілігі мен күші) | 0: Тыныс алмайды
1: Әлсіз жылау (ыңқылдау, қорсылдау)
2: Жақсы, күшті жылау |
Жүрек соғу жиілігі шкаланың жалғыз қатаң сандық құрамдас бөлігі екенін, ал қалған барлық элементтер пайымдау элементін қамтитынын ескеріңіз. Бірақ пайымдау жеке элементтерге бөлінгендіктен және олардың әрқайсысын бағалау оңай болғандықтан, тіпті орташа дайындығы бар мамандардың арасында үлкен келіспеушілік туындауы екіталай — демек, Апгар бағалауы аз шу шығарады.
Апгар шкаласы нұсқаулықтардың қалай жұмыс істейтінін және олардың шуды неге азайтатынын көрсетеді. Ережелерден немесе алгоритмдерден айырмашылығы, нұсқаулықтар пайымдау қажеттілігін жоймайды: шешім қарапайым есептеу емес. Әрбір құрамдас бөлік бойынша, демек, соңғы қорытынды бойынша келіспеушілік болуы мүмкін. Дегенмен, нұсқаулықтар шуды азайтуда табысқа жетеді, өйткені олар күрделі шешімді алдын ала анықталған өлшемдер бойынша бірқатар жеңілірек ішкі пайымдауларға ыдыратады.
Мәселені 9-тарауда талқыланған қарапайым болжау модельдері тұрғысынан қарастырғанда, бұл тәсілдің пайдасы айқын болады. Жаңа туған нәрестенің денсаулығы туралы шешім қабылдайтын клиницист бірнеше болжамды белгілерге сүйенеді. Жағдайлық шу әсер етуі мүмкін: бір күні емес, екінші күні немесе бір көңіл-күйде емес, екіншісінде клиницист салыстырмалы түрде маңызды емес болжамдарға назар аударуы немесе маңыздыларын елемеуі мүмкін. Апгар шкаласы денсаулық сақтау маманын эмпирикалық түрде маңызды екені белгілі бес белгіге шоғырландырады. Содан кейін шкала әрбір белгіні қалай бағалау керектігі туралы нақты сипаттама береді, бұл әрбір белгі деңгейіндегі пайымдауды айтарлықтай жеңілдетеді және осылайша оның шуын азайтады. Соңында, Апгар шкаласы қажетті жалпы шешімді шығару үшін болжамдарды механикалық түрде қалай өлшеу керектігін көрсетеді, әйтпесе адам клиницистері белгілерге беретін салмақтары бойынша ерекшеленетін еді. Тиісті болжамдарға назар аудару, болжау моделін қарапайымдандыру және механикалық агрегация — бұлардың барлығы шуды азайтады.
Осыған ұқсас тәсілдер көптеген медициналық салаларда қолданылған. Бір мысал — стрептококты тамақ ауруының диагнозына бағыт беретін Centor шкаласы. Емделушіге келесі белгілердің немесе симптомдардың әрқайсысы үшін бір ұпай беріледі (олардың терминдері, Апгар шкаласы сияқты, бұл нұсқаулықты алғаш рет тұжырымдаған Роберт Сентордың тегіне арналған бэкронимді құрайды): жөтелдің absence (болмауы), exudates (тамақтың артқы жағындағы ақ дақтар) болуы, мойындағы нәзік немесе ісінген nodes (лимфа түйіндері) және 100,4 градустан жоғары temperature (температура). Емделушіге берілген ұпайлар санына байланысты стрептококты фарингитті диагностикалау үшін тамақтан жағынды алу ұсынылуы мүмкін. Бағалау мен ұпай қою бұл шкаланы қолдану арқылы салыстырмалы түрде оңай, бұл стрептококты тамақ ауруын қажетсіз тексеруден және емдеуден өтетін адамдар санын тиімді түрде азайтты.
Сол сияқты, маммограммаларды түсіндірудегі шуды азайтатын Сүт безінің бейнелеуі, есеп беруі және деректер жүйесі (BI-RADS) арқылы сүт безі қатерлі ісігін диагностикалау бойынша нұсқаулықтар жасалды. Бір зерттеу BI-RADS маммограммаларды бағалауда бағалаушылар арасындағы келісімді арттырғанын анықтады, бұл нұсқаулықтардың ауытқулар айтарлықтай болған салада шуды азайтуда тиімді бола алатынын көрсетті. Патологияда нұсқаулықтарды осы мақсатта пайдалану бойынша көптеген сәтті әрекеттер болды.
Психиатриядағы көңіл көншітпейтін жағдай
Шу тұрғысынан алғанда, психиатрия — төтенше жағдай. Бірдей диагностикалық критерийлерді қолдана отырып, бір емделушіге диагноз қойғанда, психиатрлар жиі бір-бірімен келіспей қалады. Сол себепті шуды азайту кем дегенде 1940 жылдардан бастап психиатриялық қауымдастық үшін басты басымдық болып келеді. Көріп отырғанымыздай, үнемі жетілдіріліп отырғанына қарамастан, нұсқаулықтар шуды азайтуға тек азғантай ғана көмек берді.
91 емделуші мен он тәжірибелі психиатр қатысқан 1964 жылғы зерттеу екі пікірдің арасындағы келісім ықтималдығы небәрі 57% екенін анықтады. Екі психиатр тәуелсіз түрде диагноз қойған 426 мемлекеттік аурухана емделушілері қатысқан тағы бір ерте зерттеу психикалық аурудың түрі туралы диагноз қоюда тек 50% жағдайда келісім тапты. Тағы бір 153 амбулаториялық емделуші қатысқан ерте зерттеу 54% келісім тапты. Бұл зерттеулерде шудың көзі көрсетілмеген. Бір қызығы, кейбір психиатрлар емделушілерді нақты диагностикалық категорияларға жатқызуға бейім екені анықталды. Мысалы, кейбір психиатрлар емделушілерге депрессия диагнозын қоюға, ал басқалары мазасыздық диагнозын қоюға ерекше бейім болды.
Көп ұзамай көретініміздей, психиатрияда шу деңгейі әлі де жоғары. Неге бұлай? Мамандарда бір ғана нақты жауап жоқ (бұл шудың түсіндірмелерінің өзі шулы екенін білдіреді). Диагностикалық категориялардың үлкен жиынтығы сөзсіз бір фактор болып табылады. Бірақ бұл сұраққа жауап берудің алдын ала әрекетінде зерттеушілер бір психиатрдан емделушімен алдымен сұхбат жүргізуді сұрады, содан кейін қысқа үзілістен кейін екінші психиатрға тағы бір сұхбат жүргіздірді. Содан кейін екі психиатр кездесіп, егер олар келіспесе, неге олай болғанын талқылады.
Жиі кездесетін себептердің бірі «дәрігердің тұрақсыздығы» болды: әртүрлі ойлау мектептері, әртүрлі дайындық, әртүрлі клиникалық тәжірибе, әртүрлі сұхбат стилі. «Даму теориясы бойынша дайындығы бар клиницист галлюцинациялық тәжірибені өткендегі қиянаттың жарақаттан кейінгі тәжірибесінің бөлігі ретінде түсіндіруі мүмкін болса», «биомедициналық бағыттағы» басқа клиницист сол галлюцинацияларды шизофрениялық процестің бөлігі ретінде түсіндіруі мүмкін. Мұндай айырмашылықтар — заңдылық шуының мысалдары.
Дәрігерлер арасындағы айырмашылықтардан бөлек, шудың басты себебі «номенклатураның (терминдер жүйесінің) жеткіліксіздігі» болды. Мұндай бақылаулар мен психиатриялық номенклатураға жалпы кәсіби қанағаттанбаушылық Психикалық бұзылыстардың диагностикалық және статистикалық нұсқаулығының 1980 жылғы редакциясына (үшінші басылым, DSM-III) түрткі болды. Нұсқаулыққа алғаш рет психикалық бұзылыстарды диагностикалаудың нақты және егжей-тегжейлі критерийлері енгізілді, бұл диагностикалық нұсқаулықтарды енгізу бағытындағы алғашқы қадам болды.
DSM-III диагноздардың шулы екендігі туралы зерттеулердің күрт өсуіне әкелді. Ол сондай-ақ шуды азайтуға пайдалы болды. Бірақ нұсқаулық толық табысқа жете алмады. Төртінші басылымның (алғаш рет 1994 жылы жарық көрген) 2000 жылғы айтарлықтай редакциясынан (DSM-IV) кейін де зерттеулер шу деңгейі жоғары болып қалғанын көрсетті. Бір жағынан, Ахмед Аборая және оның әріптестері «психикалық бұзылыстар үшін диагностикалық критерийлерді қолдану психиатриялық диагноздардың сенімділігін арттыратыны дәлелденді» деген қорытындыға келеді. Екінші жағынан, «бір емделушіні қабылдау кезінде сол емделушіге бірнеше диагноздың қойылу» қаупі әлі де жоғары.
Нұсқаулықтың тағы бір нұсқасы DSM-5 2013 жылы шығарылды. Америкалық психиатриялық қауымдастық DSM-5 шуды азайтады деп үміттенген болатын, өйткені жаңа басылым объективтірек, нақты масштабталған критерийлерге сүйенді. Бірақ психиатрлар әлі де айтарлықтай шу көрсетуде. Мысалы, Самуэль Либлих пен оның әріптестері «психиатрлар кімде үлкен депрессиялық бұзылыс бар, кімде жоқ екендігі туралы келісуге қиналатынын» анықтады. DSM-5 үшін далалық сынақтар «минималды келісім» тапты, бұл «зерттеу жағдайындағы жоғары білікті маман психиатрлар емделушіде депрессия бар екендігіне тек 4-тен 15% жағдайда ғана келісе алды» дегенді білдіреді. Кейбір далалық сынақтарға сәйкес, DSM-5 іс жүзінде жағдайды нашарлатып, «барлық негізгі салаларда шудың жоғарылағанын көрсетті, ал аралас мазасыздық-депрессиялық бұзылыс сияқты кейбір диагноздар... клиникалық практикада пайдасыз болып көрінетіндей дәрежеде сенімсіз» болды.
Психиатриядағы нұсқаулықтардың шектеулі сәттілігінің басты себебі — кейбір бұзылыстардың «диагностикалық критерийлерінің әлі де бұлыңғыр және операционализациялау (өлшемшарттарға айналдыру) қиындығында» сияқты. Кейбір нұсқаулықтар шешімді келіспеушілік аз болатын критерийлерге бөлу арқылы шуды азайтады, бірақ мұндай критерийлер салыстырмалы түрде еркін түсіндірілетін болса, шудың қалу ықтималдығы жоғары. Осыны ескере отырып, анағұрлым стандартталған диагностикалық нұсқаулықтарды енгізу туралы маңызды ұсыныстар айтылуда. Оларға мыналар жатады: (1) бұлыңғыр стандарттардан алшақтап, диагностикалық критерийлерді нақтылау; (2) симптомдар мен олардың ауырлық деңгейінің «анықтамалық сипаттамаларын» жасау (бұл «клиникалық мамандар симптомдардың бар-жоғына келіссе, олардың диагноз бойынша да келісу ықтималдығы жоғары» деген теорияға негізделген); және (3) еркін әңгімеге қоса, пациенттермен құрылымдалған сұхбаттар жүргізу. Ұсынылған сұхбат нұсқаулықтарының бірі жиырма төрт скринингтік сұрақтан тұрады, бұл, мысалы, мазасыздық, депрессия және тамақтану бұзылыстарын сенімдірек диагностикалауға мүмкіндік береді.
Бұл қадамдар үміт берерлік болып көрінгенімен, олардың шуды азайтуда қаншалықты сәтті болатыны әлі де ашық сұрақ. Бір бақылаушының айтуынша, «пациенттің субъективті симптомдарына сену, клиникалық маманның симптомдарды түсіндіруі және объективті өлшемнің (мысалы, қан анализі) болмауы психиатриялық бұзылыстардың диагностикалық сенімсіздігінің дәнін себеді». Бұл тұрғыда психиатрия шуды азайту әрекеттеріне ерекше қарсылық танытуы мүмкін.
Бұл нақты мәселе бойынша нақты болжам жасау әлі ерте. Бірақ бір нәрсе анық: жалпы медицинада нұсқаулықтар ауытқуды (bias) да, шуды да азайтуда өте сәтті болды. Олар дәрігерлерге, медбикелерге және пациенттерге көмектесіп, процесс барысында қоғамдық денсаулықты айтарлықтай жақсартты. Медицина саласына мұндай нұсқаулықтар көбірек қажет.
Медицинадағы нұсқаулықтар туралы
«Дәрігерлер арасындағы шу деңгейі біз ойлағаннан әлдеқайда жоғары. Қатерлі ісік пен жүрек ауруларын диагностикалауда, тіпті рентген суреттерін оқуда да мамандар кейде өзара келіспей жатады. Бұл пациенттің алатын емі лотерея нәтижесіне байланысты болуы мүмкін дегенді білдіреді».
«Дәрігерлер дүйсенбі немесе жұма болсын, таңертең ерте немесе түстен кейін кеш болсын, бірдей шешім қабылдаймыз деп ойлағанды ұнатады. Бірақ дәрігерлердің не айтатыны және не істейтіні олардың қаншалықты шаршағанына байланысты болуы әбден мүмкін екені анықталды».
«Медициналық нұсқаулықтар дәрігерлердің пациенттің есебінен қателесу ықтималдығын азайтады. Мұндай нұсқаулықтар жалпы медицина саласына да көмектесе алады, өйткені олар өзгермелілікті (variability) азайтады».
23-ТАРАУ. Жұмыс өнімділігін бағалаудағы шкаланы анықтау
Жаттығудан бастайық. Өзіңіз танитын үш адамды алыңыз; олар достарыңыз немесе әріптестеріңіз болуы мүмкін. Оларды үш сипаттама бойынша: мейірімділік, интеллект және еңбекқорлық тұрғысынан 1-ден 5-ке дейінгі шкала бойынша бағалаңыз (мұнда 1 — ең төменгі, 5 — ең жоғары көрсеткіш). Енді оларды жақсы танитын басқа адамнан — жұбайыңыздан, ең жақын досыңыздан немесе әріптесіңізден — осы үш адамға қатысты дәл солай істеуін сұраңыз.
Кейбір бағалауларда сіз бен басқа бағалаушының әртүрлі сандарды көрсету ықтималдығы жоғары. Егер сіз (және сіздің серіктесіңіз) дайын болсаңыз, айырмашылықтардың себептерін талқылаңыз. Жауап шкаланы қалай қолданғаныңызда — біз деңгейлік шу (бағалаушылардың шкала деңгейлерін әртүрлі түсінуі) деп атаған нәрседе болуы мүмкін екенін байқайсыз. Бәлкім, сіз 5 деген баға шынымен ерекше нәрсені талап етеді деп ойлаған шығарсыз, ал екінші бағалаушы бұл жай ғана әдеттегіден жақсырақ нәрсені білдіреді деп есептеген болар. Немесе айырмашылық бағаланып жатқан адамдар туралы көзқарастарыңыздың әртүрлілігінен туындауы мүмкін: олардың мейірімді екендігі туралы түсінігіңіз және бұл қасиетті нақты қалай анықтайтыныңыз басқа бағалаушыдан өзгеше болуы ықтимал.
Енді сіз бағалаған үш адам үшін лауазымды өсіру немесе бонус мәселесі шешіліп жатыр деп елестетіңіз. Айталық, сіз бен екінші бағалаушы мейірімділікті (немесе ұжымшылдықты), интеллектті және еңбекқорлықты бағалайтын компанияда жұмыс өнімділігін бағалаумен айналысып жатырсыз. Бағаларыңыздың арасында айырмашылық болар ма еді? Ол алдыңғы жаттығудағыдай үлкен болар ма еді? Немесе одан да үлкен бе? Бұл сұрақтарға қалай жауап берілсе де, саясат пен шкала қолданудағы айырмашылықтар шу тудыруы мүмкін. Шын мәнінде, бұл ұйымдық ортадағы жұмыс өнімділігін бағалауда жаппай байқалатын құбылыс.
Шешім қабылдау тапсырмасы
Барлық дерлік ірі ұйымдарда жұмыс өнімділігі жүйелі түрде ресми бағаланады. Бағаланатындар бұл процестен ләззат алмайды. Бір газет тақырыбында айтылғандай: «Зерттеулер көрсеткендей, іс жүзінде әрбір адам жұмыс өнімділігін шолуды жек көреді». Әрбір адам жұмыс өнімділігін шолудың ауытқуға да, шуға да бейім екенін біледі (біздің ойымызша). Бірақ көптеген адамдар олардың қаншалықты шулы екенін біле бермейді.
Мінсіз әлемде адамдардың жұмыс өнімділігін бағалау шешім қабылдау тапсырмасы болмас еді; адамдардың қаншалықты жақсы жұмыс істейтінін анықтау үшін объективті фактілер жеткілікті болар еді. Бірақ қазіргі заманғы ұйымдардың көбі Адам Смиттің әр жұмысшының өлшенетін өнімі болған түйреуіш фабрикасына мүлдем ұқсамайды. Қаржы директоры немесе зерттеу бөлімінің басшысы үшін ол «өнім» қандай болмақ? Бүгінгі білім қызметкерлері (ақпаратпен және зияткерлік еңбекпен айналысатын мамандар) бірнеше, кейде бір-біріне қарама-қайшы мақсаттарды теңестіреді. Олардың біреуіне ғана назар аудару қате бағалауға және зиянды ынталандыру әсерлеріне әкелуі мүмкін. Мысалы, дәрігердің күніне қабылдайтын пациенттерінің саны аурухана өнімділігінің маңызды көрсеткіші, бірақ сіз дәрігерлердің тек осы көрсеткішке ғана назар аударғанын, тіпті тек соның негізінде бағаланып, марапатталғанын қаламас едіңіз. Тіпті өлшенетін көрсеткіштердің өзі — айталық, сатушының сату көлемі немесе бағдарламашы жазған код жолдарының саны — контекстте бағалануы тиіс: барлық клиенттерге қызмет көрсету бірдей қиын емес және барлық бағдарламалық қамтамасыз етуді әзірлеу жобалары бірдей емес. Осы қиындықтарды ескере отырып, көптеген адамдарды тек объективті көрсеткіштер негізінде бағалау мүмкін емес. Сондықтан шешім қабылдауға негізделген жұмыс өнімділігін шолулар барлық жерде кездеседі.
Ширек бөлігі — сигнал, үш ширегі — шу
Жұмыс өнімділігін бағалау тәжірибесі бойынша мыңдаған зерттеу мақалалары жарияланды. Зерттеушілердің көбі мұндай бағалаулардың шектен тыс шулы екенін анықтады. Бұл көңіл көншітпейтін қорытынды негізінен 360 градустық бағалау (қызметкерді жан-жақтан: басшысы, әріптестері және қол астындағылары тарапынан бағалау) негізінде жасалған зерттеулерден алынған. Бұл талдау жүргізілгенде, нәтиже көңіл қуантпайды. Зерттеулер жиі нақты айырмашылықтың, яғни адамның өнімділігіне байланысты ауытқудың жалпы ауытқудың 20-30%-ынан аспайтынын көрсетеді. Қалған 70-80%-ы — жүйелік шу.
Бұл шу қайдан шығады? Жұмыс өнімділігін бағалаудағы ауытқуларды зерттеген көптеген жұмыстардың арқасында біз жүйелік шудың барлық компоненттері бар екенін білеміз.
Бұл компоненттерді жұмыс өнімділігін бағалау контекстінде елестету өте оңай. Екі бағалаушыны — Линн мен Мэриді алайық. Егер Линн жұмсақ, ал Мэри қатал болса (яғни, Линн барлық бағаланатын адамдарға Мэриге қарағанда орташа есеппен жоғары баға берсе), онда бізде деңгейлік шу бар. Судьялар туралы талқылауымызда айтылғандай, бұл шу Линн мен Мэридің шынымен әртүрлі әсерде болғанын немесе екі бағалаушының бірдей әсерді білдіру үшін бағалау шкаласын әртүрлі қолданғанын білдіруі мүмкін.
Енді, егер Линн сізді бағалап жатса және сіз бен сіздің қосқан үлесіңіз туралы ерекше төмен пікірде болса, оның жалпы жұмсақтығы сізге деген жеке (және теріс) реакциясымен өтелуі мүмкін. Бұл біз тұрақты заңдылық деп атаған нәрсе: белгілі бір бағалаушының белгілі бір бағаланушыға деген нақты реакциясы. Бұл заңдылық тек Линнге ғана тән болғандықтан (және оның сіз туралы шешіміне байланысты), ол заңдылық шуының (pattern noise) көзі болып табылады.
Соңында, Мэри бағалау парағын толтырмас бұрын компания тұрағында біреу оның көлігін сызып кеткенін білген болуы мүмкін немесе Линн күтпеген жерден жомарт бонус алып, сіздің жұмысыңызды бағалап жатқанда ерекше көңіл-күй көтеріңкілігінде болуы мүмкін. Мұндай оқиғалар, әрине, сәттік шуды (occasion noise) тудыруы мүмкін.
Әртүрлі зерттеулер жүйелік шудың осы үш компонентке (деңгей, заңдылық және сәт) бөлінуі бойынша әртүрлі қорытындыларға келеді және бұл көрсеткіштердің бір ұйымнан екіншісіне неге өзгеретінін елестете аламыз. Бірақ шудың барлық түрлері жағымсыз. Осы зерттеулерден шығатын негізгі хабар қарапайым: жұмыс өнімділігін бағалаудың көпшілігі бағаланатын адамның нақты жұмысына қарағанда басқа нәрселерге көбірек байланысты. Бір шолуда түйінделгендей, «жұмыс өнімділігі мен оның бағалануы арасындағы байланыс әлсіз немесе ең жақсы жағдайда белгісіз болуы мүмкін».
Сонымен қатар, ұйымдардағы бағалаулар бағалаушының қызметкердің нақты жұмысы туралы қабылдауын көрсетпеуінің көптеген себептері бар. Мысалы, бағалаушылар өнімділікті дәл бағалауға тырыспауы мүмкін, керісінше адамдарды «стратегиялық түрде» бағалауы мүмкін. Басқа себептермен қатар, бағалаушылар кері байланыс кезіндегі қиын әңгімеден қашу үшін, көптен күткен лауазымды өсуді қалайтын адамға қолдау көрсету үшін немесе тіпті, парадоксальды түрде, басқа бөлімге ауысуы үшін жақсы баға қажет ететін нашар жұмыс істейтін топ мүшесінен құтылу үшін бағаны әдейі көтеруі мүмкін.
Бұл стратегиялық есептеулер бағалауға сөзсіз әсер етеді, бірақ олар шудың жалғыз көзі емес. Біз мұны табиғи эксперимент арқылы білеміз: кейбір 360 градустық кері байланыс жүйелері тек даму мақсаттары үшін қолданылады. Бұл жүйелерде респонденттерге кері байланыс бағалау мақсатында қолданылмайтыны айтылады. Бағалаушылар айтылғандарға шынымен сенетін болса, бұл тәсіл оларды бағаны көтеруден немесе түсіруден тежейді. Анықталғандай, дамуға арналған шолу кері байланыс сапасына әсер етеді, бірақ жүйелік шу бәрібір жоғары болып қала береді және бағаланатын адамның өнімділігіне қарағанда ауытқудың көп бөлігін құрайды. Тіпті кері байланыс таза даму мақсатында болғанның өзінде, бағалаулар шулы болып қала береді.
Ескі проблема әлі де шешілмеген
Егер жұмыс өнімділігін бағалау жүйелері осыншалықты бұзылған болса, өнімділікті өлшейтін адамдар бұған назар аударып, оларды жақсартуы керек. Шынында да, соңғы бірнеше онжылдықта ұйымдар бұл жүйелерге сансыз реформалар жасап, тәжірибеден өткізді. Реформалар біз атап өткен шуды азайтудың кейбір стратегияларын қолданды. Біздің ойымызша, бұдан да көп нәрсе істеуге болады.
Барлық дерлік ұйымдар агрегациялау (деректерді біріктіру) арқылы шуды азайту стратегиясын қолданады. Агрегатталған бағалаулар көбінесе 1990-жылдары ірі корпорацияларда стандартқа айналған 360 градустық бағалау жүйелерімен байланысты.
Бірнеше бағалаушының бағаларын орташалау жүйелік шуды азайтуға көмектескенімен, 360 градустық кері байланыс жүйелері бұл мәселенің емі ретінде ойлап табылғанын емес екенін атап өткен жөн. Олардың негізгі мақсаты — басшы көретін нәрседен әлдеқайда көп нәрсені өлшеу. Сіздің өнімділігіңізді бағалауға тек басшыңыз ғана емес, әріптестеріңіз бен қол астындағыларыңыз да қатысқанда, бағаланатын құндылықтың сипаты өзгереді. Теория бойынша, бұл өзгеріс жақсы жаққа бағытталған, өйткені бүгінгі жұмыстар тек басшының көңілінен шығудан да көп нәрсені талап етеді. 360 градустық кері байланыстың танымалдылығы икемді, жобаға негізделген ұйымдардың көбеюімен тұспа-тұс келді.
Кейбір дәлелдер 360 градустық кері байланыстың объективті өлшенетін өнімділікті болжай алатын пайдалы құрал екенін көрсетеді. Өкінішке орай, бұл кері байланыс жүйесін қолдану өзіндік қиындықтарды туғызды. Компьютерлендіру кері байланыс жүйелеріне көбірек сұрақтар қосуды жеңілдеткендіктен және корпоративтік мақсаттар мен шектеулердің көбеюі жұмыс сипаттамаларына жаңа өлшемдер қосқандықтан, көптеген кері байланыс сауалнамалары абсурдты түрде күрделі болып кетті. «Артық жобаланған» сауалнамалар өте көп (бір мысалда әрбір бағалаушы мен бағаланушы үшін он бір өлшем бойынша қырық алты бағалау қарастырылған). Осыншама көп өлшем бойынша бағаланатын көптеген адамдар туралы нақты, өзекті фактілерді еске түсіру және өңдеу үшін бағалаушыға υπερ-адамдық (superhuman) қасиет қажет болар еді. Кейбір жағынан, бұл тым күрделі тәсіл тек пайдасыз ғана емес, сонымен бірге зиянды. Біз көргеніміздей, ореол әсері (halo effect - адамның бір жақсы қасиетіне бола оның барлық қасиеттерін жоғары бағалау) бөлек болуы тиіс өлшемдердің іс жүзінде бөлек қарастырылмайтынын білдіреді. Алғашқы сұрақтардың біріне берілген күшті оң немесе теріс баға кейінгі сұрақтарға жауаптарды да сол бағытқа тартуға бейім болады.
Одан да маңыздысы, 360 градустық жүйелердің дамуы кері байланыс беруге кететін уақытты экспоненциалды түрде арттырды. Орта буын менеджерлерінен барлық деңгейдегі әріптестері туралы, кейде тіпті басқа ұйымдардағы серіктестері туралы ондаған сауалнамаларды толтыру талап етілуі сирек емес, өйткені қазір көптеген компаниялар клиенттерден, жеткізушілерден және басқа бизнес-серіктестерден кері байланыс сұрайды. Қаншалықты игі ниетті болса да, уақыты шектеулі бағалаушыларға қойылатын бұл шектен тыс талаптар олар беретін ақпараттың сапасын жақсартады деп күтуге болмайды. Бұл жағдайда шуды азайту оған кететін шығынға тұрмауы мүмкін — бұл мәселені біз 6-бөлімде талқылаймыз.
Соңында, 360 градустық жүйелер барлық өнімділікті өлшеу жүйелерінің жаппай дертіне — бағалардың өсу инфляциясына төтеп бере алмайды. Бір ірі өнеркәсіптік компания бірде өз менеджерлерінің 98%-ы «күтулерді толық ақтайды» деп бағаланғанын байқаған. Барлығы дерлік ең жоғары баға алған кезде, бұл бағалаулардың құндылығына күмән келтіру орынды.
Салыстырмалы шешімдерді қолдау
Бағалау инфляциясы мәселесінің теориялық тұрғыдан тиімді шешімі — бағалауға стандарттау енгізу. Мұны жүзеге асыруды мақсат ететін танымал тәжірибенің бірі — мәжбүрлі рейтинг (forced ranking). Мәжбүрлі рейтинг жүйесінде бағалаушыларға барлығына ең жоғары баға беруге тыйым салынып қана қоймай, сонымен қатар алдын ала белгіленген үлестірімге бағынуға мәжбүр етеді. Мәжбүрлі рейтингті Джек Уэлч General Electric компаниясының бас директоры болған кезде бағалаудағы инфляцияны тоқтату және жұмыс өнімділігін шолудағы «ашықтықты» қамтамасыз ету тәсілі ретінде ұсынған. Көптеген компаниялар оны қабылдады, бірақ кейінірек моральдық жағдай мен топтық жұмысқа жағымсыз әсерлерін алға тартып, одан бас тартты.
Кемшіліктеріне қарамастан, рейтингтер (салыстыру) бағалауларға (шкала бойынша белгілеу) қарағанда шуды азырақ тудырады. Біз жазатайым шығындар мысалында көргеніміздей, абсолютті шешімдерге қарағанда салыстырмалы шешімдерде шу әлдеқайда аз болады және бұл байланыс жұмыс өнімділігін бағалауда да дәлелденген.


17-СУРЕТ: Абсолютті және салыстырмалы бағалау шкалаларының мысалдары
Мұның себебін түсіну үшін қызметкерлерді бағалауға арналған шкалалардың екі мысалы көрсетілген 17-суретке назар аударыңыз. А бөлімінде қызметкер абсолютті шкала бойынша бағаланады, бұл біз сәйкестендіру операциясы деп атаған нәрсені талап етеді: қызметкердің «жұмыс сапасы» туралы әсеріңізге барынша сәйкес келетін ұпайды табу. Керісінше, Б бөлімі әрбір жеке тұлғаны белгілі бір өлшем — қауіпсіздік — бойынша басқалар тобымен салыстыруды талап етеді. Бақылаушыдан пайыздық шкаланы қолдана отырып, қызметкердің белгілі бір топтағы орнын (немесе процентилін) көрсету сұралады. Біз бақылаушының осы ортақ шкала бойынша үш қызметкерді қалай орналастырғанын көре аламыз.
Б бөліміндегі тәсілдің екі артықшылығы бар. Біріншіден, барлық қызметкерлерді бір уақытта бір өлшем бойынша бағалау (бұл мысалда қауіпсіздік) — біз келесі тарауда толығырақ талқылайтын шуды азайту стратегиясының үлгісі: күрделі шешімді бірнеше өлшемге құрылымдау. Құрылымдау — ореол әсерін шектеу әрекеті, ол әдетте бір адамның әртүрлі өлшемдер бойынша бағаларын шағын диапазонда ұстайды. (Құрылымдау, әрине, рейтинг әр өлшем бойынша жеке жасалғанда ғана жұмыс істейді: қызметкерлерді «жұмыс сапасы» деген бұлдыр, жиынтық шешім бойынша рейтингке қою ореол әсерін азайта алмайды.) Екіншіден, 15-тарауда талқылағанымыздай, рейтингке қою заңдылық шуын да, деңгейлік шуды да азайтады. Сіз өз тобыңыздың екі мүшесінің жұмысын салыстырған кезде, олардың әрқайсысына жеке баға бергенге қарағанда, сәйкессіздік таныту (және заңдылық шуын тудыру) ықтималдығыңыз азырақ. Ең бастысы, рейтингтер деңгейлік шуды механикалық түрде жояды. Егер Линн мен Мэри жиырма қызметкерден тұратын бір топты бағаласа және Линн Мэриден жұмсағырақ болса, олардың орташа бағалары әртүрлі болады, бірақ орташа рейтингтері (орны) бірдей болады. Жұмсақ бағалаушы да, қатал бағалаушы да бірдей орындарды қолданады.
Шынында да, шуды азайту — барлық бағалаушылардың бірдей орташа мәнге және бірдей баға үлестіріміне ие болуын қамтамасыз ететін мәжбүрлі рейтингтің негізгі мәлімделген мақсаты. Бағалау үлестірімі міндеттелгенде рейтингтер «мәжбүрлі» болады. Мысалы, ереже бойынша бағаланатын адамдардың 20%-дан аспайтынын ең жоғарғы санатқа, ал 15%-дан азын ең төменгі санатқа қою керек деп белгіленуі мүмкін.
Рейтингке қойыңыз, бірақ мәжбүрлемеңіз
Теория жүзінде мәжбүрлі рейтинг қажетті жақсартуларды әкелуі тиіс. Дегенмен, ол жиі кері әсер береді. Біз бұл жерде оның барлық ықтимал жағымсыз салдарларын қарастыруды көздемейміз (олар көбінесе қағидаға емес, нашар орындалуға байланысты). Бірақ мәжбүрлі рейтинг жүйелеріндегі екі мәселе жалпы сабақтар береді.
Біріншісі — абсолютті және салыстырмалы өнімділік арасындағы шатасу. Кез келген компания менеджерлерінің 98%-ы өз тобының үздік 20, 50 немесе тіпті 80%-ында болуы әсте мүмкін емес. Бірақ егер бұл күтулер алдын ала және абсолютті терминдермен анықталса, олардың барлығы «күтулерді ақтауы» мүмкін емес емес.
Көптеген басшылар барлық дерлік қызметкерлер күтулерді ақтай алады деген пікірге қарсы шығады. Олай болса, дейді олар, күтулер тым төмен, бәлкім, бұл тоқмейілсу мәдениетінің кесірінен шығар. Бұл түсіндірменің жаны бар болуы мүмкін, бірақ қызметкерлердің көпшілігі шынымен де жоғары күтулерді ақтауы да әбден мүмкін. Шынында да, біз жоғары өнімді ұйымнан дәл осыны күтеміз. Егер сәтті ғарыш миссиясындағы барлық астронавттар күтулерді толық ақтады деп естісеңіз, сіз НАСА-ның өнімділікті басқару процедураларының жұмсақтығына күлмес едіңіз.
Түйін: салыстырмалы бағалауға негізделген жүйе ұйым салыстырмалы өнімділікке мән бергенде ғана орынды. Мысалы, салыстырмалы бағалау адамдардың абсолютті жұмысына қарамастан, олардың белгілі бір пайызы ғана жоғарылатылуы мүмкін болғанда мағыналы болады — генерал шеніне жоғарылату үшін бағаланып жатқан полковниктерді елестетіңіз. Бірақ көптеген компаниялар істеп жүргендей, абсолютті өнімділік деңгейін өлшеуі тиіс нәрсеге мәжбүрлі салыстырмалы рейтингті таңу қисынсыз. Ал қызметкерлердің белгілі бір пайызы күтулерді ақтамады (абсолютті түрде) деп бағалануын талап ету тек қатыгездік емес, бұл абсурд. Әскердің элиталық бөлімінің 10%-ы «қанағаттанарлықсыз» деп бағалануы тиіс деу ақымақтық болар еді.
Екінші мәселе — бағалаудың мәжбүрлі үлестірімі негізгі нақты өнімділіктің үлестірімін көрсетеді деп болжануы (әдетте қалыпты үлестірімге жақын нәрсе). Дегенмен, бағаланатын популяциядағы өнімділік үлестірімі белгілі болса да, дәл осы үлестірім бір бағалаушы бағалайтын кішігірім топта қайталанбауы мүмкін. Егер сіз бірнеше мың адамнан тұратын популяциядан кездейсоқ он адамды таңдасаңыз, олардың дәл екеуі жалпы популяцияның үздік 20%-ына жататынына кепілдік жоқ. («Кепілдік жоқ» деген жұмсартып айтқандық: бұлай болу ықтималдығы небәрі 30%). Іс жүзінде мәселе бұдан да нашар, өйткені топтардың құрамы кездейсоқ емес. Кейбір бөлімдер толығымен жоғары өнімді қызметкерлерден, ал басқалары нашар жұмыс істейтіндерден тұруы мүмкін.
Мұндай жағдайда мәжбүрлі рейтинг қателік пен әділетсіздіктің көзі болып табылады. Айталық, бір бағалаушының тобы жұмысы бір-бірінен ажырағысыз бес адамнан тұрады. Осы біркелкі шындыққа сараланған баға үлестірімін мәжбүрлеп енгізу қателікті азайтпайды. Ол оны арттырады.
Мәжбүрлі рейтингті сынға алушылар көбіне рейтинг принципінің өзін қатыгез, адамгершілікке жатпайтын және ақыр соңында кері әсерін тигізетін әдіс деп айыптайды. Бұл аргументтерді қабылдасаңыз да, қабылдамасаңыз да, мәжбүрлі рейтингтің (қызметкерлерді алдын ала белгіленген пайыздық үлестер бойынша бөлу жүйесі) басты кемшілігі «рейтингте» емес, «мәжбүрлі» сипатында. Кез келген бағалау сәйкес емес шкалаға мәжбүрлеп таңылса — абсолюттік өнімділікті өлшеу үшін салыстырмалы шкала қолданылғандықтан немесе бағалаушылар бір-бірінен ажырату мүмкін емес нәрселерді ажыратуға мәжбүр болғандықтан — шкаланы таңдау процесі механикалық түрде шуды арттырады.
Әрі қарай не болмақ?
Ұйымдардың өнімділікті өлшеуді жақсартуға бағытталған барлық талпыныстарына қарамастан, нәтижелер көңіл көншітпейді. Осы күш-жігердің салдарынан өнімділікті бағалау шығындары күрт өсті. 2015 жылы Deloitte компаниясы өзінің алпыс бес мың қызметкерін бағалауға жыл сайын 2 миллион сағат жұмсайтынын есептеді.
Өнімділікті тексеру ұйымдардағы ең жек көрінішті ритуалдардың бірі болып қала береді; оны бағалауды жүргізушілер де, баға алушылар да бірдей ұнатпайды. Бір зерттеу менеджерлердің, қызметкерлердің және HR басшыларының 90%-ы өнімділікті басқару процестері күтілетін нәтижені бермейтініне сенетінін көрсетті.
Зерттеулер көптеген менеджерлердің басынан өткерген жағдайын растады. Өнімділік туралы кері байланыс қызметкердің даму жоспарымен ұштасса, жақсартуларға әкелуі мүмкін, бірақ қазіргі қолданыстағы рейтингтер ынталандырудан гөрі, көбіне жігерді құм қияды.
Жаңа бағыттар
Шарасыздықтан, кейбір компаниялар бағалау жүйелерінен толықтай бас тарту сияқты радикалды нұсқаны қарастыруда. Бұл «өнімділікті басқару революциясының» жақтаушылары бағалауға емес, болашаққа бағытталған даму туралы кері байланысқа назар аударуды көздейді. Кейбіреулері тіпті дәстүрлі рейтингтерден бас тартып, бағалауды сансыз (цифрсыз) форматқа көшірді.
Өнімділік рейтингтерінен бас тартпайтын компаниялар үшін шуды азайтудың бір стратегиясы — дұрыс шкаланы таңдау. Мақсат — ортақ сілтемелік негізді қамтамасыз ету.
Мінез-құлыққа негізделген бағалау шкалалары (Behaviorally anchored rating scales — BARS) — шкаланың әрбір деңгейі нақты мінез-құлық сипаттамаларына сәйкес келетін әдіс. 18-суреттің сол жақ панелінде мысал келтірілген.
Алайда, мұндай шкалалар шуды жою үшін жеткіліксіз. Келесі қадам — эталондық жүйе бойынша оқыту (frame-of-reference training). Мұнда бағалаушылар өнімділіктің әртүрлі өлшемдерін тануға үйретіледі. Олар видеоға түсірілген көріністерді бағалау арқылы жаттығады, содан кейін өз бағаларын сарапшылардың «шынайы» бағаларымен салыстырады.
Кейс-шкала (case scale) — әрбір бағалау эталондық жағдайлармен салыстыру арқылы жүзеге асатын жүйе. Бұл салыстырмалы пайымдауға айналады. Салыстырмалы пайымдаулар шуға азырақ бейім болғандықтан, кейс-шкалалар сандарға немесе сын есімдерге негізделген шкалаларға қарағанда сенімдірек.

18-СУРЕТ: Мінез-құлыққа негізделген бағалау шкаласының (сол жақта) және кейс-шкаланың (оң жақта) мысалы
Эталондық жүйе бойынша оқыту ондаған жылдар бойы белгілі болса да, ол кең таралмады. Себебі бұл әдіс күрделі, уақытты қажет етеді және әр бөлімше үшін жеке бейімделуі тиіс. Сонымен қатар, шуды азайту менеджерлердің бағалауға ықпал ету мүмкіндігін шектейді, бұл олардың тарапынан қарсылық тудырады.
Өнімділікті бағалау көптеген философиялық сұрақтарды тудырады: - Қазіргі ұжымдық жұмыс жағдайында «жеке өнімділік» ұғымы қаншалықты маңызды? - Өнімділік қалыпты үлестірімге бағына ма, әлде «жұлдызды таланттар» үлесі басым ба? - Адамдарды қорқыныш пен ашкөздік арқылы ынталандыру ең жақсы әдіс пе?
Егер сіз өнімділікті өлшейтін болсаңыз, рейтингтеріңізге жүйелік шу еніп кеткен болуы әбден мүмкін. Бұл шуды азайту технологиялық шешімдерді емес, бағалау шкаласын нақтылауды және адамдарды оны дұрыс қолдануға үйретуді талап етеді.
— «Біз өнімділік рейтингтеріне көп уақыт жұмсаймыз, бірақ нәтиженің төрттен бірі ғана өнімділікке, ал төрттен үші жүйелік шуға тиесілі». — «Бұл мәселені шешу үшін 360 градустық кері байланыс пен мәжбүрлі рейтингті қолданып көрдік, бірақ жағдайды одан сайын қиындатып алған сияқтымыз». — «Деңгейлік шудың көп болуы — әртүрлі бағалаушылардың «жақсы» немесе «керемет» дегенді әртүрлі түсінуінен. Олар тек нақты кейстерді эталон ретінде бергенде ғана ортақ келісімге келеді».
24-ТАРАУ
Жұмысқа қабылдаудағы құрылым
Егер сіз бұрын-соңды жұмыс істеген болсаңыз, жұмысқа қабылдау сұхбаты деген сөздер стресстік естеліктерді оятуы мүмкін. Көптеген ұйымдарға кіру үшін бұл — міндетті ритуал.
Әдетте сұхбаттар белгілі бір сценариймен өтеді: Амандасу және танысу. Тәжірибе туралы сұрақтар. Жетістіктер, қиындықтар және мотивация туралы әңгіме. Кандидаттың компания мәдениетіне сәйкестігін тексеру. Соңында кандидаттың өз сұрақтары.
Жұмысқа қабылдау сұхбаттарының кең таралуы біздің таңдау жасау кезіндегі түйсігімізге (интуициямызға) деген терең сенімімізді көрсетеді. 1917 жылдың өзінде-ақ кадрларды іріктеу «ең басты мәселе» деп танылған.
Сұхбаттардың қауіптілігі Егер сіздің мақсатыңыз қай кандидаттың жұмыста табысты болатынын анықтау болса, стандартты сұхбаттар (немесе құрылымдалмаған сұхбаттар) өте аз ақпарат береді. Тіпті, олар көбіне пайдасыз.
Зерттеулерге сәйкес, әдеттегі сұхбат бағасы мен жұмыс өнімділігі арасындағы корреляция (екі көрсеткіш арасындағы байланыс деңгейі) небары 0. 28-ді құрайды. Бұл дегеніміз, егер сіз сұхбатта жақсы көрінген кандидатты таңдасаңыз, оның шынымен жақсы жұмыс істеу ықтималдығы 56-61% ғана. Бұл тиын тастап таңдағаннан сәл ғана жақсы.
Сұхбаттағы шу
Сұхбаттардағы қателіктердің бір бөлігі <span data-term="true">объективті білместікке</span> (objective ignorance) байланысты: жұмыс өнімділігіне жұмысқа алған сәтте болжау мүмкін емес көптеген факторлар әсер етеді.
Сұхбаттар — психологиялық бейімділіктердің «миналанған алаңы». Сұхбат алушылар бейсаналы түрде өздеріне ұқсайтын (нәсілі, жынысы, білімі бойынша) адамдарға артықшылық береді. Тіпті сыртқы келбет пен қол алысудың нықтығы да шешімге әсер етіп кетеді.
Паттерндік шу (pattern noise) — әртүрлі сұхбат алушылардың бір кандидатқа деген әртүрлі реакциясы. Тіпті бірге отырып сұхбат алған екі маманның кандидат туралы пікірі төрттен бір жағдайда сәйкес келмейді.
Жағдайлық шу (occasion noise) — шешімнің сәтсіз кездейсоқтықтарға байланысты болуы. Мәселен, алғашқы екі-үш минуттағы «танысу» кезеңінде қалыптасқан бірінші әсер сұхбаттың бүкіл нәтижесін айқындап жіберуі мүмкін.
Сұхбат алушылардың психологиясы
Бірінші әсер неге соншалықты маңызды? Себебі, дәстүрлі сұхбатта мамандар өздерінің алғашқы ойын растайтын сұрақтар қоюға бейім. Егер кандидат ұялшақ болып көрінсе, оған командамен жұмыс туралы қатал сұрақтар қойылуы мүмкін, ал көңілді көрінген адамға мұндай сұрақтар қойылмауы ықтимал.
Бір таңқаларлық тәжірибеде студенттерге сұхбат алушы рөлі беріліп, ал кандидаттарға кездейсоқ (иә немесе жоқ деп) жауап беру тапсырылған. Нәтижесінде бірде-бір сұхбат алушы кандидаттың мағынасыз жауап беріп жатқанын байқамаған! Біздің миымыз тіпті мағынасыз деректерден де логикалық байланыс құрастыруға шебер.
Авторлардың бірі бұрынғы қаржы директорымен сұхбат жүргізді. Кандидат жұмыстан «бас директормен стратегиялық келіспеушілік» салдарынан кеткенін айтты. Оң пікірдегі сұхбат алушы мұны «батылдық пен адалдық» деп түсінді, ал теріс пікірдегі адам мұны «икемсіздік пен балалық» деп қабылдады. Бұл біздің фактілерді алдын ала қалыптасқан көзқарасымызға қарай бұрмалайтынымызды көрсетеді.
Дәстүрлі сұхбаттардың шектеулері олардан қандай да бір мағыналы қорытынды шығару қабілетімізге үлкен күмән ұялатады. Дегенмен, сұхбат кезінде қалыптасқан әсерлер өте айқын болады және сұхбат алушы әдетте оларға сенімді келеді. Сұхбаттағы қорытындыларды үміткер туралы басқа белгілермен біріктіргенде, біз сұхбатқа тым көп мән беріп, тест нәтижелері сияқты болжамдық мәні жоғарырақ басқа деректерге аз көңіл бөлуге бейімбіз.
Бір оқиға бұл бақылауды түсіндіруге көмектесуі мүмкін. Факультеттегі лауазымға сұхбат беретін профессорлардан олардың оқыту дағдылары мекеме стандарттарына сәйкестігін тексеру үшін әріптестерінің алдында сабақ беру сұралады. Бұл, әрине, қарапайым сабаққа қарағанда жауапкершілігі жоғары жағдай. Біздің біріміз осындай жаттығу кезінде үміткердің жағымсыз әсер қалдырғанына куә болдық, бұл анық стресстің салдары еді: үміткердің түйіндемесінде оқыту сапасының тамаша бағалары мен оқытудағы үздік жетістіктері үшін бірнеше марапаттар көрсетілген болатын. Соған қарамастан, оның бір ғана жасанды жағдайдағы сәтсіздігінен туындаған айқын әсер, оның бұрынғы үздік оқыту нәтижелері туралы дерексіз мәліметтерден гөрі соңғы шешімге көбірек әсер етті.
Соңғы сәт: сұхбат үміткерлер туралы жалғыз ақпарат көзі болмаған кезде — мысалы, тесттер, ұсыныстар немесе басқа да мәліметтер болса — бұл әртүрлі деректерді жалпы шешімге біріктіру қажет. Бұл жерде сізге таныс сұрақ туындайды: бұл мәліметтер пайымдау ( клиникалық агрегация — сарапшының өз түйсігіне сүйеніп ақпаратты біріктіруі) арқылы ма, әлде формула ( механикалық агрегация — алдын ала белгіленген ереже бойынша ақпаратты қорыту) арқылы біріктірілуі керек пе? 9-тарауда көргеніміздей, механикалық тәсіл жалпы жағдайда да, жұмыс өнімділігін болжаудың нақты жағдайында да жоғары нәтиже береді. Өкінішке орай, сауалнамалар HR мамандарының басым көпшілігі клиникалық агрегацияны жөн көретінін көрсетеді. Бұл тәжірибе онсыз да шулы процеске тағы бір шу (шешім қабылдаудағы қателіктер мен ауытқулар) көзін қосады.
Құрылым арқылы қызметкерлерді іріктеуді жақсарту
Егер дәстүрлі сұхбаттар мен пайымдауға негізделген жалдау шешімдерінің болжамдық дәлдігі шектеулі болса, біз не істей аламыз? Бақытымызға орай, зерттеулер қызметкерлерді іріктеуді қалай жақсартуға болатыны туралы бірнеше кеңестер берді және кейбір компаниялар бұған назар аударуда.
Өзінің қызметкерлерді іріктеу тәжірибесін жаңартқан және нәтижелері туралы есеп берген компанияның бір мысалы — Google. Оның People Operations бөлімінің бұрынғы аға вице-президенті Ласло Бок бұл оқиғаны өзінің Work Rules! кітабында баяндайды. Ең жоғары деңгейдегі таланттарды жалдауға назар аударып, дұрыс адамдарды табуға қомақты ресурстар бөлгеніне қарамастан, Google қиындықтарға тап болды. Оның рекрутингтік сұхбаттарының болжамдық дәлдігіне жүргізілген аудит "нөлдік байланысты (... ), толық ретсіздікті" көрсетті. Google бұл жағдайды түзету үшін енгізген өзгерістер ондаған жылдар бойғы зерттеулерден туындаған принциптерді көрсетеді. Олар сондай-ақ шешім гигиенасы стратегияларының үлгісі болып табылады.
Осы стратегиялардың бірі сізге таныс болуы керек: агрегация. Оның бұл контексте қолданылуы таңқаларлық емес. Барлық дерлік компаниялар бір үміткер бойынша бірнеше сұхбат алушының пайымдауларын біріктіреді. Google-да үміткерлер кейде жиырма бес сұхбаттан өтетін! Боктың талдауының қорытындыларының бірі бұл санды төртке дейін азайту болды, өйткені ол қосымша сұхбаттар алғашқы төртеуі берген болжамдық дәлдікке ештеңе қоспайтынын анықтады.
Алайда, бұл дәлдік деңгейін қамтамасыз ету үшін Google барлық компаниялар сақтай бермейтін ережені қатаң түрде енгізеді: компания сұхбат алушылардың бір-бірімен сөйлескенге дейін үміткерді бөлек бағалауын қадағалайды. Тағы да қайталаймыз: агрегация жұмыс істейді — бірақ тек пайымдаулар тәуелсіз болған жағдайда ғана.
Google сонымен қатар біз әлі толық сипаттамаған шешім гигиенасы стратегиясын қабылдады: күрделі пайымдауларды құрылымдау. Құрылым термині көп нәрсені білдіруі мүмкін. Біз мұнда қолданғандай, құрылымдалған күрделі пайымдау үш принциппен анықталады: декомпозиция, тәуелсіздік және кешіктірілген тұтас пайымдау.
Бірінші принцип, декомпозиция (күрделі мәселені қарапайым бөлшектерге ыдырату), шешімді құрамдас бөліктерге немесе аралық бағалауларға бөледі. Бұл қадам нұсқаулықтағы қосалқы пайымдауларды анықтаумен бірдей мақсатқа қызмет етеді: ол бағалаушылардың назарын маңызды белгілерге аударады. Декомпозиция қандай деректер қажет екенін көрсететін жол картасы ретінде әрекет етеді және қатысы жоқ ақпаратты сүзгіден өткізеді.
Google жағдайында декомпозицияда төрт аралық бағалау бар: жалпы когнитивті қабілет, көшбасшылық, мәдени сәйкестік ( "googleyness" — Google компаниясының ішкі мәдениетіне тән қасиеттер), лауазымға қатысты білім. (Осы бағалаулардың кейбірі содан кейін кішігірім бөліктерге бөлінеді.)
Үміткердің сырт келбеті, сөзуарлығы, қызықты хоббиі және рекрутер құрылымдалмаған сұхбатта байқауы мүмкін кез келген басқа жағымды немесе жағымсыз аспектілер тізімде жоқ екеніне назар аударыңыз.
Жалдау тапсырмасы үшін мұндай құрылым жасау жай ғана ақылға қонымды болып көрінуі мүмкін. Шынында да, егер сіз бастапқы деңгейдегі бухгалтерді немесе әкімшілік көмекшіні жалдасаңыз, стандартты жұмыс сипаттамалары бар және қажетті құзыреттер көрсетілген. Алайда, кәсіби рекрутерлер білетіндей, ерекше немесе жоғары лауазымдар үшін негізгі бағалауларды анықтау қиындай түседі және бұл анықтау қадамы жиі назардан тыс қалады. Бір көрнекті кадр іздеуші маман қажетті құзыреттерді жеткілікті дәрежеде нақты анықтау қиын, жиі ескерілмейтін тапсырма екенін атап өтеді. Ол шешім қабылдаушылар үшін "мәселені анықтауға инвестиция салудың" маңыздылығын көрсетеді: кез келген үміткермен кездесуден бұрын, нақты және егжей-тегжейлі жұмыс сипаттамасын келісу үшін алдын ала қажетті уақытты жұмсау керек. Мұндағы қиындық — көптеген сұхбат алушылардың консенсус пен ымыра арқылы жасалған, тым көпіртілген жұмыс сипаттамаларын қолдануында. Бұл сипаттамалар — мінсіз үміткер ие болуы тиіс қасиеттердің бұлыңғыр тілектер тізімі және олар сипаттамаларды калибрлеу немесе олардың арасында таңдау жасау жолын ұсынбайды.
Құрылымдалған пайымдаудың екінші принципі — тәуелсіздік, әрбір бағалау бойынша ақпараттың тәуелсіз жиналуын талап етеді. Жұмыс сипаттамасының құрамдас бөліктерін тізіп шығу ғана жеткіліксіз: дәстүрлі сұхбаттар өткізетін рекрутерлердің көпшілігі де үміткерден іздейтін төрт-бес нәрсені біледі. Мәселе мынада: сұхбат барысында олар бұл элементтерді бөлек бағаламайды. Әрбір бағалау басқаларына әсер етеді, бұл әр бағалауды өте шулы етеді.
Бұл мәселені жеңу үшін Google бағалауды деректерге негізделген және бір-бірінен тәуелсіз түрде жүргізу жолдарын ұйымдастырды. Оның ең көрнекті қадамы — құрылымдалған мінез-құлық сұхбаттарын енгізу болды. Мұндай сұхбаттардағы сұхбат алушылардың міндеті үміткердің жалпы ұнайтынын немесе ұнамайтынын шешу емес; бұл бағалау құрылымындағы әрбір бағалау бойынша деректер жинау және әр бағалау бойынша үміткерге ұпай беру.
Ол үшін сұхбат алушылардан үміткердің өткен жағдайлардағы мінез-құлқы туралы алдын ала белгіленген сұрақтарды қою талап етіледі. Олар сондай-ақ жауаптарды жазып алуы және бірыңғай айдарды қолданып, оларды алдын ала белгіленген рейтингтік шкала бойынша бағалауы керек. Айдар әр сұрақ бойынша орташа, жақсы немесе тамаша жауаптардың қандай болатынына мысалдар береді. Бұл ортақ шкала (алдыңғы тарауда біз таныстырған мінез-құлыққа негізделген рейтингтік шкалалардың мысалы) пайымдаулардағы шуды азайтуға көмектеседі.
Егер бұл тәсіл дәстүрлі, еркін сұхбаттан өзгеше естілсе, ол солай. Шын мәнінде, ол іскерлік кездесуден гөрі емтиханға немесе жауап алуға көбірек ұқсауы мүмкін және үміткерлерге де, сұхбат алушыларға да құрылымдалған сұхбаттар ұнамайтыны туралы (немесе кем дегенде құрылымдалмағандарын жөн көретіні туралы) кейбір дәлелдер бар. Сұхбаттың құрылымдалған деп саналуы үшін оған нақты не кіруі керектігі туралы пікірталастар жалғасуда. Соған қарамастан, сұхбат алу туралы әдебиеттердегі ең дәйекті тұжырымдардың бірі — құрылымдалған сұхбаттар дәстүрлі, құрылымдалмағандарға қарағанда болашақ өнімділікті әлдеқайда дәлірек болжайды. Жұмыс өнімділігімен корреляция 0,44 пен 0,57 аралығында болады. Біздің PC (Pairwise Concordance) метрикамызды қолдансақ, құрылымдалған сұхбат арқылы жақсырақ үміткерді таңдау мүмкіндігіңіз 65-тен 69%-ға дейін, бұл құрылымдалмаған сұхбат беретін 56-дан 61%-ға дейінгі мүмкіндіктен айтарлықтай жоғары.
Google өзіне маңызды кейбір өлшемдер бойынша басқа деректерді де қолданады. Жұмысқа қатысты білімді тексеру үшін ол ішінара жұмыс үлгісінің тесттеріне (бағдарламалау бойынша жұмысқа үміткерден код жазуды сұрау сияқты) сүйенеді. Зерттеулер жұмыс үлгісінің тесттері жұмыс барысындағы өнімділіктің ең жақсы болжағыштарының бірі екенін көрсетті. Google сонымен қатар "жанама ұсыныстарды" (үміткер көрсетпеген, бірақ онымен бұрын жолдары түскен Google қызметкерлерінен алынған мәлімет) қолданады.
Құрылымдалған пайымдаудың үшінші принципі — кешіктірілген тұтас пайымдау, оны қарапайым рецептпен қорытындылауға болады: интуицияны жоққа шығармаңыз, бірақ оны кешіктіріңіз. Google-да жалдау туралы соңғы ұсынысты жалдау комитеті алқалы түрде қабылдайды, ол үміткерлердің әрбір сұхбаттағы әрбір бағалау бойынша алған барлық рейтингтерінің толық файлын және осы бағалауларды растайтын басқа да тиісті ақпаратты қарап шығады. Осы ақпарат негізінде комитет жұмысқа шақыру (оффер) жіберу-жібермеу туралы шешім қабылдайды.
Бұл компанияның деректерге негізделген мәдениетіне қарамастан және деректердің механикалық комбинациясы клиникалық комбинациядан асып түсетіні туралы барлық дәлелдерге қарамастан, соңғы жалдау шешімі механикалық емес. Бұл әлі де пайымдау болып қала береді, онда комитет барлық дәлелдерді ескереді және оларды тұтастай салмақтайды, "Бұл адам Google-да табысты бола ма? " деген сұрақты талқылайды. Шешім жай ғана есептелмейді.
Келесі тарауда біз соңғы шешім қабылдауға арналған бұл тәсілдің неліктен орынды екенін түсіндіреміз. Бірақ назар аударыңыз, Google-дың соңғы жалдау шешімдері механикалық болмаса да, олар төрт сұхбат алушы берген орташа ұпайға негізделген. Олар сондай-ақ негізгі дәлелдермен негізделген. Басқаша айтқанда, Google өзінің шешім қабылдау процесінде пайымдау мен интуицияға тек барлық дәлелдер жиналып, талданғаннан кейін ғана рұқсат береді. Осылайша, әрбір сұхбат алушының (және жалдау комитеті мүшесінің) тез, интуитивті әсер қалыптастыруға және шешім шығаруға асығу бейімділігі бақылауда ұсталады.
Үш принцип — тағы да қайталаймыз: декомпозиция, әр өлшем бойынша тәуелсіз бағалау және кешіктірілген тұтас пайымдау — іріктеу процестерін жақсартуға тырысатын барлық ұйымдар үшін міндетті шаблон бола бермейді. Бірақ бұл принциптер ұйымдық психологтардың жылдар бойы жасаған ұсыныстарымен кеңінен сәйкес келеді. Шын мәнінде, бұл принциптер біздің біріміз (Канеман) 1956 жылы Израиль армиясында енгізген және Thinking, Fast and Slow кітабында сипатталған іріктеу әдісіне ұқсайды. Бұл процесс, Google енгізген процесс сияқты, бағалау құрылымын (бағалануы тиіс тұлғалық және құзыреттілік өлшемдерінің тізімі) ресімдеді. Ол сұхбат алушылардан әрбір өлшемге қатысты объективті дәлелдерді кезекпен алуды және келесіге өтпес бұрын сол өлшемді бағалауды талап етті. Және ол рекрутерлерге соңғы шешім қабылдау үшін пайымдау мен интуицияны қолдануға рұқсат берді — бірақ тек құрылымдалған бағалау жүргізілгеннен кейін ғана.

Жалдау кезінде құрылымдалған пайымдау процестерінің (соның ішінде құрылымдалған сұхбаттардың) артықшылығы туралы бұлтартпас дәлелдер бар. Оларды енгізгісі келетін басшыларға бағыт-бағдар беретін практикалық кеңестер қолжетімді. Google мысалы көрсеткендей және басқа зерттеушілер атап өткендей, құрылымдалған пайымдау әдістерінің құны да төменірек — өйткені бетпе-бет кездесу уақытынан қымбат ештеңе жоқ. Соған қарамастан, басшылардың көпшілігі бейресми, сұхбатқа негізделген әдістердің таптырмас құндылығына сенімді болып қала береді. Бір қызығы, тек бетпе-бет сұхбат қана болашақ жұмыс берушіге өздерінің нағыз қабілетін көрсетуге мүмкіндік береді деп сенетін көптеген үміткерлер де солай ойлайды. Зерттеушілер мұны "иллюзияның сақталуы" деп атады. Бір нәрсе анық: рекрутерлер мен үміткерлер жалдау туралы шешімдердегі шуды өте қатты бағаламайды.
Жалдаудағы құрылым туралы айтсақ
"Дәстүрлі, бейресми сұхбаттарда бізде жиі үміткерді түсіну және бұл адамның бізге сәйкес келетінін білу туралы тойтарыс берілмейтін, интуитивті сезім болады. Біз сол сезімге сенбеуді үйренуіміз керек. "
"Дәстүрлі сұхбаттар тек біржақтылық (биас) себебінен ғана емес, сонымен қатар шудың себебінен де қауіпті. "
"Біз сұхбаттарымызға және кеңірек айтқанда, іріктеу процестерімізге құрылым қосуымыз керек. Үміткерлерден не іздейтінімізді әлдеқайда анық және нақты анықтаудан бастайық және үміткерлерді осы өлшемдердің әрқайсысы бойынша тәуелсіз бағалайтынымызға көз жеткізейік. "
25-ТАРАУ Аралық бағалау хаттамасы
Біраз уақыт бұрын біздің екеуіміз (Канеман мен Сибони), досымыз Дэн Ловалломен бірге ұйымдарда шешім қабылдау әдісін сипаттадық. Біз шуды азайтуды негізгі мақсат ретінде қарастырып жасалған бұл әдісті аралық бағалау хаттамасы ( mediating assessments protocol ) деп атадық. Ол біз алдыңғы тарауларда таныстырған шешім гигиенасы стратегияларының көпшілігін қамтиды. Хаттаманы кеңінен және жоспарды немесе нұсқаны бағалау бірнеше өлшемдерді қарастыруды және салмақтауды талап ететін кез келген уақытта қолдануға болады. Оны әртүрлі компаниялар, ауруханалар, университеттер және мемлекеттік органдарды қоса алғанда, барлық түрдегі ұйымдар қолдана алады және әртүрлі жолдармен бейімдей алады.
Біз хаттаманы мұнда бірнеше нақты жағдайлардың жиынтығы болып табылатын стильдендірілген мысалмен көрсетеміз: біз оны Mapco деп атайтын ойдан шығарылған корпорация деп алайық. Біз Mapco-ның ірі, трансформациялық сатып алу мүмкіндігін зерттеу барысында жасаған қадамдарын қадағалаймыз және олардың компанияның мұндай жағдайда жасайтын әдеттегі қадамдарынан қалай ерекшеленетінін атап өтеміз. Көріп отырғаныңыздай, айырмашылықтар маңызды, бірақ нәзік — аңғарғыш емес бақылаушы оларды байқамауы да мүмкін.
Бірінші кездесу: Тәсіл бойынша келісу
Бәсекелес болып табылатын Roadco компаниясын сатып алу идеясы Mapco-да бұрыннан айтылып жүрген және компания басшылары оны талқылау үшін директорлар кеңесінің отырысын өткізуді ойластыратындай дәрежеде пісіп-жетілді. Mapco-ның бас директоры Джоан Моррисон ықтимал сатып алуды алдын ала талқылау және директорлар кеңесінің бұл мәселе бойынша талқылауын қалай жақсарту керектігін қарастыру үшін кеңестің стратегиялық комитетінің отырысын шақырды. Кездесудің басында Джоан комитетті өз ұсынысымен таң қалдырды:
"Мен Roadco-ны сатып алу туралы шешім қабылдайтын кеңес отырысы үшін жаңа процедураны қолданып көруді ұсынғым келеді. Жаңа процедураның атауы онша тартымды емес — аралық бағалау хаттамасы, бірақ идеясы өте қарапайым. Ол стратегиялық нұсқаны бағалау мен жұмысқа үміткерді бағалау арасындағы ұқсастықтан шабыт алған.
"Құрылымдалған сұхбаттар құрылымдалмағандарға қарағанда жақсы нәтиже беретінін көрсететін зерттеулермен және кеңірек айтқанда, жалдау туралы шешімді құрылымдау оны жақсартатыны туралы идеямен таныс екеніңізге сенімдімін. Біздің HR бөліміміз жалдау шешімдері үшін осы принциптерді қабылдағанын білесіздер. Көптеген зерттеулер сұхбаттағы құрылымның әлдеқайда жоғары дәлдікке әкелетінін көрсетеді — біз бұрын қолданған құрылымдалмаған сұхбаттар оған тіпті жақындай алмайды.
"Мен үміткерлерді бағалау мен үлкен шешімдердегі нұсқаларды бағалау арасында нақты ұқсастықты көремін: нұсқалар үміткерлер сияқты. Бұл ұқсастық мені үміткерлерді бағалауда жұмыс істейтін әдісті біздің стратегиялық нұсқаларды бағалау міндетімізге бейімдеу керек деген идеяға әкелді. "
Комитет мүшелері бастапқыда бұл ұқсастыққа таң қалды. Рекрутинг процесі, деп уәж айтты олар, көптеген ұқсас шешімдер қабылдайтын және уақыттың қатаң қысымында емес, жақсы жолға қойылған машина. Ал стратегиялық шешім, керісінше, көптеген арнайы жұмысты талап етеді және тез қабылдануы керек. Кейбір комитет мүшелері Джоанға шешімді кешіктіретін кез келген ұсынысқа қарсы болатындарын анық білдірді. Олар сондай-ақ Mapco-ның зерттеушілеріне қосымша тексеру (due-diligence) талаптарының қосылуына алаңдаушылық білдірді.
Джоан бұл қарсылықтарға тікелей жауап берді. Ол әріптестеріне құрылымдалған процестің шешімді кешіктірмейтініне сендірді. "Бұл мәмілені талқылайтын кеңес отырысының күн тәртібін белгілеу туралы", - деп түсіндірді ол. "Сұхбат алушы үміткер ие болуы тиіс қасиеттер немесе атрибуттардың бақылау тізімі ретінде қызмет ететін жұмыс сипаттамасынан бастайтыны сияқты, біз де мәміленің әртүрлі аспектілерін бағалау тізімін алдын ала шешіп алуымыз керек. Біз кеңестің бұл бағалауларды бөлек-бөлек талқылайтынына көз жеткіземіз, дәл құрылымдалған сұхбаттағы сұхбат алушылар сияқты үміткерді бөлек өлшемдер бойынша кезекпен бағалаймыз. Содан кейін ғана біз мәмілені қабылдау немесе қабылдамау туралы талқылауға көшеміз. Бұл процедура кеңестің ұжымдық даналығын пайдаланудың әлдеқайда тиімді жолы болады.
"Егер біз бұл тәсілге келіссек, әрине, бұл ақпараттың қалай ұсынылуы керектігіне және мәміле тобының кездесуге дайындық барысында қалай жұмыс істеуі керектігіне әсер етеді. Сондықтан мен қазір сіздердің ойларыңызды білгім келді. "
Әлі де күмәнмен қараған бір комитет мүшесі Джоаннан құрылым жалдау кезінде шешім қабылдау сапасына қандай пайда әкелгенін және бұл пайда стратегиялық шешімге ауысатынына неге сенетінін сұрады. Джоан оған логиканы түсіндіріп берді. Аралық бағалау хаттамасын қолдану, деп түсіндірді ол, бағалау өлшемдерін бір-бірінен тәуелсіз ұстау арқылы ақпараттың құндылығын барынша арттырады. "Бізде әдетте болатын кеңес талқылаулары құрылымдалмаған сұхбаттарға өте ұқсас", - деп атап өтті ол. "Біз шешімге қол жеткізудің түпкі мақсатын үнемі есімізде сақтаймыз және барлық ақпаратты сол мақсат тұрғысынан өңдейміз. Біз мәселені тезірек жабуға тырысамыз және оған мүмкіндігінше тез қол жеткіземіз. Құрылымдалмаған сұхбаттағы рекрутер сияқты, біз де барлық пікірталастарды өзіміздің алғашқы әсерлерімізді растау үшін пайдалану қаупіндеміз.
"Құрылымдалған тәсілді қолдану бізді барлық бағалауларды жасағанша шешім қабылдау мақсатын кейінге қалдыруға мәжбүр етеді. Біз бөлек бағалауларды аралық мақсаттар ретінде қабылдаймыз. Осылайша, біз барлық қолжетімді ақпаратты қарастырамыз және мәміленің бір аспектісі бойынша қорытындымыз басқа, байланысы жоқ аспектіні қабылдауымызды өзгертпейтініне көз жеткіземіз. "
Комитет мүшелері бұл тәсілді қолданып көруге келісті. Бірақ, олар сұрады: аралық бағалаулар қандай? Джоанның ойында алдын ала белгіленген бақылау тізімі бар ма? "Жоқ", - деп жауап берді ол. "Егер біз хаттаманы күнделікті шешімге қолдансақ, солай болуы мүмкін еді, бірақ бұл жағдайда аралық бағалауларды өзіміз анықтауымыз керек. Бұл өте маңызды: сатып алудың бағалануы тиіс негізгі аспектілерін шешу — біздің еркімізде. " Стратегиялық комитет мұны жасау үшін келесі күні қайта кездесуге келісті.
Екінші кездесу: Аралық бағалауларды анықтау
"Біз бірінші кезекте жасайтын нәрсе", - деп түсіндірді Джоан, "мәміле туралы тәуелсіз бағалаулардың толық тізімін жасау. Бұларды Джефф Шнайдердің зерттеу тобы бағалайтын болады. Біздің бүгінгі міндетіміз — бағалаулар тізімін құру. Ол кез келген тиісті фактінің өз орнын тауып, бағалаулардың кем дегенде біреуіне әсер ететініндей мағынада толық болуы керек. Менің 'тәуелсіз' деп отырғаным — артықтықты азайту үшін тиісті факт жақсырақ тек бір ғана бағалауға әсер етуі тиіс. "
Топ жұмысқа кірісіп, мәселеге қатысты болуы мүмкін деректер мен ақпараттардың ұзын-сонар тізімін жасады. Кейін оларды бағалаулар тізіміне топтастырды. Қатысушылар көп ұзамай бұл тізімді қысқа, ауқымды және бірін-бірі қайталамайтын бағалаулардан құрастыру оңай шаруа емес екенін түсінді. Дегенмен, бұл тапсырманы орындау мүмкін еді. Шын мәнінде, топтың жеті бағалаудан тұратын қорытынды тізімі директорлар кеңесі компанияны сатып алу туралы есепте күтетін мазмұнға сырттай ұқсас болды. Күтілетін қаржылық модельдеуден бөлек, бұл тізімге, мысалы, сатып алынатын нысанның басқару тобының сапасын бағалау және күтілетін синергияның (бірлескен жұмыстың тиімділігі) жүзеге асу ықтималдығын талдау кірді.
Стратегиялық комитеттің кейбір мүшелері жиналыста Roadco туралы жаңа идеялардың айтылмағанына көңілдері толмады. Бірақ Джоан түсіндіргендей, мақсат бұл емес еді. Негізгі міндет — сатып алуды зерттеуге жауапты мәміле тобына нұсқаулық беру болатын. Оның айтуынша, әрбір бағалау мәміле тобының есебінде жеке тарау болып жазылып, кеңесте бөлек талқылануы тиіс.
Джоанның пайымдауынша, мәміле тобының миссиясы директорлар кеңесіне мәміле туралы жалпы пікірді айту емес (кем дегенде, әзірге). Олардың міндеті — әрбір аралық бағалау бойынша объективті, тәуелсіз талдау жасау. Соңында, Джоан түсіндіргендей, мәміле тобы есебінің әрбір тарауы қарапайым сұраққа жауап беретін рейтингпен аяқталуы керек: «Бұл тақырыптың түпкілікті шешімдегі салмағын есепке алмағанда, осы бағалау бойынша айғақтар мәмілені қаншалықты қолдайды немесе оған қарсы уәж айтады? »
Мәміле тобы
Мәмілені бағалауға жауапты топтың жетекшісі Джефф Шнайдер сол күні түстен кейін жұмысты ұйымдастыру үшін өз командасын жинады. Топтың әдеттегі жұмыс тәртібіне енгізілген өзгерістер көп емес еді, бірақ ол олардың маңыздылығын баса айтты.
Біріншіден, ол команда сарапшылары өз талдауларын мүмкіндігінше объективті жүргізуі керектігін түсіндірді. Бағалаулар деректерге негізделуі тиіс (бұл жаңалық емес), бірақ мүмкін болған жағдайда сыртқы көзқарас (шешімді жеке түйсікке емес, ұқсас жағдайлардың статистикасына сүйеніп бағалау) әдісін де қолдануы қажет. Топ мүшелері «сыртқы көзқарастың» не екенін түсінбегендіктен, Джефф Джоан белгілеген аралық бағалаулардың екеуін мысалға келтірді. Мәміленің реттеуші органдардан мақұлдау алу ықтималдығын бағалау үшін, олар алдымен базалық мөлшерлемені (салыстырмалы транзакциялардың мақұлдану пайызы), яғни ұқсас мәмілелердің қанша пайызы мақұлданғанын анықтауы керек. Бұл тапсырма, өз кезегінде, олардан эталондық топты (салыстыруға жеткілікті деңгейде ұқсас деп саналатын мәмілелер тобы) анықтауды талап етеді.
Содан кейін Джефф сатып алынатын нысанның өнім әзірлеу бөлімінің технологиялық дағдыларын қалай бағалау керектігін түсіндірді. «Компанияның соңғы жетістіктерін деректермен сипаттап, оларды «жақсы» немесе «керемет» деп атау жеткіліксіз. Менің күтетінім: «Бұл өнім әзірлеу бөлімі өнімді нарыққа шығару көрсеткіші бойынша өз саласындағы ұқсас компаниялардың екінші квинтиліне (деректер жиынтығын бес тең бөлікке бөлгендегі үлес) жатады» деген сияқты нақтылық. Жалпы алғанда, ол бағалауларды мүмкіндігінше салыстырмалы түрде жасауды тапсырды, өйткені салыстырмалы пайымдаулар абсолютті пайымдаулардан әлдеқайда тиімдірек.
Джеффтің тағы бір талабы болды. Джоанның нұсқауларына сәйкес, бір бағалаудың екіншісіне әсер ету қаупін азайту үшін олар бір-бірінен барынша тәуелсіз болуы керек. Сондықтан ол әртүрлі сарапшыларға әртүрлі бағалауларды бөліп беріп, оларға бір-бірінен дербес жұмыс істеуді тапсырды.
Кейбір сарапшылар таңғалыс білдірді. «Командалық жұмыс жақсы емес пе? » — деп сұрады олар. «Егер біздің араласуымызды қаламасаңыз, команда жинаудың мәні неде? »
Джефф тәуелсіздіктің не үшін қажет екенін түсіндіру керек екенін ұқты. «Сендер жұмысқа алу кезіндегі гало-эффект (адам туралы жалпы әсердің оның нақты қабілеттерін бағалауға ықпал етуі) туралы білетін шығарсыңдар,» — деді ол. «Бұл — үміткер туралы жалпы алған әсеріңіз оның белгілі бір саладағы дағдыларын бағалауыңызға әсер еткенде болатын құбылыс. Біз дәл осыдан аулақ болғымыз келеді». Кейбір сарапшылар бұл мәселені аса маңызды деп санамағандықтан, Джефф басқа ұқсастықты қолданды: «Егер қылмысқа куә болған төрт адам болса, олардың айғақ бермес бұрын бір-бірімен сөйлесуіне рұқсат берер ме едіңіз? Әрине, жоқ! Бір куәгердің екіншісіне ықпал еткенін қаламайсыз». Сарапшылар бұл салыстыруды өздері үшін аса жағымды көрмесе де, бұл Джеффтің ойын нақты жеткізді.
Алайда, Джеффте бағалаулардың толық тәуелсіздігіне қол жеткізу үшін сарапшылар саны жеткіліксіз болды. Тәжірибелі мүшелердің бірі Джейнге екі бағалау тапсырылды. Джефф бұл екі бағалауды бір-біріне мүлдем ұқсамайтындай етіп таңдап, Джейнге екіншісіне көшпес бұрын біріншісін аяқтап, есебін дайындауды тапсырды. Тағы бір алаңдаушылық басқару тобының сапасын бағалауға қатысты болды; Джефф сарапшылар компанияның соңғы нәтижелерін (оларды міндетті түрде егжей-тегжейлі зерттейді) топтың ішкі сапасынан бөліп қарай алмай қала ма деп қорықты. Бұл мәселені шешу үшін Джефф басқару тобының сапасына баға беру үшін сырттан HR сарапшысын шақырды. Осылайша, ол анағұрлым тәуелсіз мәлімет аламын деп шешті.
Джеффтің командаға таңсық көрінген тағы бір нұсқауы болды. Әрбір тарау бір бағалауға арналуы керек және Джоан талап еткендей, рейтинг түріндегі қорытындымен аяқталуы тиіс. Сонымен қатар, Джефф сарапшыларға әр тарауға бағалауға қатысты барлық нақты ақпаратты қосуды тапсырды. «Ештеңені жасырмаңдар,» — деді ол. «Тараудың жалпы реңкі ұсынылған рейтингке сәйкес келетіні анық, бірақ негізгі рейтингке сәйкес келмейтін немесе тіпті қайшы келетін ақпарат болса, оны бүркемелемеңдер. Сендердің жұмыстарың — өз ұсыныстарыңды «өткізу» емес, шындықты көрсету. Егер шындық күрделі болса, солай болсын — ол көбіне солай болады».
Осы рухта Джефф сарапшыларды әр бағалаудағы сенімділік деңгейін ашық көрсетуге ынталандырды. «Директорлар кеңесі сендерде толық ақпарат жоқ екенін біледі; егер қай жерде күмәндансаңдар, соны ашық айтсаңдар, оларға көмек болады. Ал егер мәмілені тоқтатуға мәжбүр ететін маңызды кедергіге тап болсаңдар, оны дереу хабарлауларың керек».
Мәміле тобы нұсқаулық бойынша әрекет етті. Бақытқа орай, ешқандай үлкен кедергілер табылмады. Олар Джоан мен кеңес үшін барлық белгіленген бағалауларды қамтитын есепті құрастырды.
Шешім қабылдау жиыны
Джоан шешім қабылдау жиынына дайындалу үшін топтың есебін оқып жатып, бір маңызды жайтты бірден байқады: бағалаулардың көбі мәмілені қолдағанымен, олар жағдайды тым керемет немесе мінсіз етіп көрсетпеген. Кейбір рейтингтер жоғары болса, кейбіреулері төмен болды. Бұл айырмашылықтар бағалауларды бір-бірінен тәуелсіз жүргізудің болжамды нәтижесі екенін ол жақсы түсінді. Артық үйлесімділік шектелгенде, шындық көптеген директорлар кеңесінің презентацияларындағыдай бірсарынды болмай шығады. «Жақсы,» — деп ойлады Джоан. «Бағалаулар арасындағы бұл алшақтықтар сұрақтар туғызып, талқылауға түрткі болады. Кеңесте сапалы пікірталас жүргізу үшін бізге дәл осы керек. Әртүрлі нәтижелер шешім қабылдауды жеңілдетпейтіні анық — бірақ олар шешімнің сапасын арттырады».
Джоан есепті қарап, шешім қабылдау үшін кеңес мүшелерін жинады. Ол мәміле тобы ұстанған тәсілді түсіндіріп, кеңес мүшелерін де дәл осы қағиданы қолдануға шақырды. «Джефф пен оның командасы бағалауларды бір-бірінен тәуелсіз ұстау үшін көп еңбектенді,» — деді ол, «енді біздің міндетіміз — оларды да тәуелсіз түрде қарап шығу. Бұл дегеніміз, біз түпкілікті шешімді талқыламас бұрын, әрбір бағалауды жеке-жеке қарастырамыз. Біз әрбір бағалауды күн тәртібіндегі бөлек тақырып ретінде қабылдаймыз».
Кеңес мүшелері мұндай құрылымдық тәсілді ұстану қиын болатынын білді. Джоан олардан барлық бағалаулар талқыланбайынша мәміле туралы тұтас пікір қалыптастырмауды сұрады, бірақ олардың көбі осы саланың мамандары еді. Олардың Roadco туралы өз пікірлері бар болатын. Оны талқыламау біршама жасанды көрінді. Дегенмен, Джоанның неге қол жеткізгісі келетінін түсінгендіктен, олар оның ережелерімен ойнауға және жалпы көзқарастарын талқылаудан уақытша бас тартуға келісті.
Өздері таңғалғандай, кеңес мүшелері бұл тәжірибенің өте құнды екенін байқады. Жиналыс кезінде олардың кейбіреулері тіпті мәміле туралы ойларын өзгертті (бірақ бұл туралы ешкім білмеді, өйткені олар өз пікірлерін іште сақтады). Джоанның жиналысты жүргізу тәсілі үлкен рөл атқарды: ол бағалау-талқылау-бағалау (алдын ала бағалау беріп, кейін талқылап, соңында қайта бағалау) әдісін қолданды, бұл әдіс ақылдасу мен тәуелсіз пікірлердің орташа мәнін алудың артықшылықтарын біріктіреді.
Ол былай істеді: әрбір бағалау бойынша Джефф мәміле тобының атынан негізгі деректерді қысқаша баяндады (кеңес мүшелері оларды алдын ала егжей-тегжейлі оқып шыққан болатын). Содан кейін Джоан кеңес мүшелерінен телефондарындағы дауыс беру қосымшасын пайдаланып, осы бағалауға өз рейтингтерін беруді сұрады — бұл мәміле тобы ұсынған рейтингпен бірдей немесе басқаша болуы мүмкін еді. Рейтингтердің үлестірімі бірден экранда көрсетілді, бірақ кімнің қандай баға бергені жасырын қалды. «Бұл дауыс беру емес,» — деп түсіндірді Джоан. «Біз жай ғана әр тақырып бойынша ортақ көңіл-күйді байқап жатырмыз». Талқылауды бастамас бұрын әрбір мүшенің тәуелсіз пікірін білу арқылы Джоан әлеуметтік ықпал мен ақпараттық каскадтардың (адамдардың өз білгенінен гөрі көпшіліктің шешіміне соқыр ілесуі) қаупін азайтты.
Кейбір бағалаулар бойынша бірден ортақ келісім орнаса, басқаларында қарама-қайшы көзқарастар анықталды. Әрине, Джоан талқылауды соңғыларына көбірек уақыт бөлетіндей етіп ұйымдастырды. Ол әр тараптың өкілдерінің сөйлеуін қадағалап, оларды өз көзқарастарын деректермен және уәждермен, сонымен бірге биязылық пен қарапайымдылықпен білдіруге шақырды. Бірде мәмілені қатты қолдайтын кеңес мүшесі қызынып кеткенде, ол: «Біз бәріміз парасатты адамдармыз және келіспей жатырмыз, демек бұл — парасатты адамдардың пікірі қайшы келуі мүмкін тақырып,» — деп ескертті.
Бағалауды талқылау аяқталғанда, Джоан мүшелерден рейтингке қайта дауыс беруді сұрады. Көп жағдайда екінші кезеңде пікірлер біріншіге қарағанда жақындай түсті. Дәл осы тізбек — бірінші бағалау, талқылау және екінші бағалау — әрбір бағалау үшін қайталанды.
Соңында, мәміле туралы түпкілікті шешім қабылдайтын уақыт келді. Талқылауды жеңілдету үшін Джефф тақтаға бағалаулар тізімін және кеңес берген орташа рейтингтерді шығарды. Кеңес мүшелері мәміленің жалпы бейнесіне қарап отырды. Олар қалай шешім қабылдауы керек?
Кеңес мүшелерінің бірі қарапайым ұсыныс айтты: рейтингтердің орташа мәнін қолдану. (Мүмкін, ол 9-тарауда айтылған механикалық жинақтаудың интуитивті пайымдаудан артықшылығы туралы білетін шығар). Алайда, басқа мүше бұған бірден қарсы шығып, кейбір бағалауларға басқаларына қарағанда әлдеқайда жоғары салмақ берілуі керек деп есептеді. Үшінші адам бұнымен де келіспей, бағалаулардың басқаша иерархиясын ұсынды.
Джоан талқылауды тоқтатты. «Бұл тек бағалау рейтингтерінің қарапайым комбинациясын есептеу емес,» — деді ол. «Біз интуицияны кейінге қалдырдық, бірақ енді оны қолданатын кез келді. Қазір бізге сендердің пайымдауларың қажет».
Джоан өз логикасын түсіндірмеді, бірақ ол бұл сабақты өмірдің ащы тәжірибесінен алған еді. Ол, әсіресе маңызды шешімдер кезінде, адамдардың өздерін шектейтін және пайымдауларын қолдануға мүмкіндік бермейтін жүйелерді қабылдамайтынын білетін. Ол шешім қабылдаушылардың, егер соңғы сөзді формула айтатынын білсе, жүйені қалай алдайтынын көрген. Олар қалаған нәтижеге қол жеткізу үшін рейтингтерді өзгерте салады — бұл бүкіл жаттығудың мәнін жояды. Сонымен қатар, бұл жағдайда орын алмаса да, ол бағалаулар тізімінде ескерілмеген шешуші факторлардың (10-тарауда айтылған сынған аяқ факторлары — статистикалық модель ескере алмайтын, бірақ шешімді өзгертетін сирек кездесетін айқын жағдайлар) пайда болу мүмкіндігіне әрдайым сақ болды. Егер мұндай күтпеген кедергілер (немесе керісінше, мәмілені міндетті ететін жағдайлар) пайда болса, бағалаулардың орташа мәніне негізделген таза механикалық процесс үлкен қателікке әкелуі мүмкін.
Джоан сонымен қатар кеңес мүшелеріне осы кезеңде интуицияны қолдануға рұқсат берудің процестің басында қолданудан мүлдем басқа екенін білді. Енді бағалаулар қолжетімді және бәріне мәлім болғандықтан, түпкілікті шешім осы деректерге негізделген, жан-жақты талқыланған рейтингтерге нық бекітілген. Кеңес мүшесі мәмілені қолдайтын бағалаулар тізіміне қарап отырып, оған қарсы шығу үшін өте салмақты себептер табуы керек болады. Осы логикаға сүйене отырып, кеңес мәмілені талқылап, барлық кеңестер сияқты дауыс берді.
Қайталанатын шешімдердегі аралық бағалау хаттамасы
Біз аралық бағалау хаттамасын бір реттік, ерекше шешім контекстінде сипаттадық. Бірақ бұл процедура қайталанатын шешімдерге де қолданылады. Mapco компаниясы бір ғана сатып алумен айналыспай, стартаптарға қайта-қайта инвестиция салатын венчурлық қор деп елестетіңіз. Хаттама дәл солай қолданылады және процесс дерлік ұқсас болады, тек оны тіпті қарапайым ететін екі ерекшелік бар.
Біріншіден, бастапқы қадам — аралық бағалаулар тізімін анықтау — тек бір рет қана жасалады. Қордың барлық әлеуетті инвестицияларына қолданатын инвестициялық критерийлері бар: бұлар — бағалаулар. Оларды әр уақытта жаңадан ойлап табудың қажеті жоқ.
Екіншіден, егер қор бір типтегі көптеген шешімдер қабылдаса, ол өз тәжірибесін пайымдауларын дәлдеу (калибрлеу) үшін пайдалана алады. Мысалы, кез келген қор жасағысы келетін бағалауды алайық: басқару тобының сапасын бағалау. Біз мұндай бағалауларды эталондық топқа қатысты жасауды ұсындық. Мүмкін, сіз Mapco сарапшыларына жанашырлық танытқан шығарсыз: нақты нысанды бағалаумен қатар, ұқсас компаниялар туралы мәлімет жинау қиын шаруа.
Салыстырмалы пайымдаулар қайталанатын шешімдер контекстінде әлдеқайда жеңілдейді. Егер сіз ондаған, тіпті жүздеген компаниялардың басқару топтарын бағалаған болсаңыз, осы ортақ тәжірибені эталондық топ ретінде пайдалана аласыз. Мұны істеудің практикалық жолы — «зәкірлік жағдайлар» арқылы анықталған шкала жасау. Мысалы, сіз: «Нысанның басқару тобы біз сатып алған кездегі ABC компаниясының басқару тобымен бірдей жақсы, бірақ DEF компаниясының басқару тобындай емес,» — деп айта аласыз. Зәкірлік жағдайлар, әрине, барлық қатысушыларға мәлім болуы (және мерзімді түрде жаңартылуы) тиіс. Оларды анықтау алдын ала уақыт бөлуді талап етеді. Бірақ бұл тәсілдің құндылығы — салыстырмалы пайымдаулар (осы топты ABC және DEF топтарымен салыстыру) сандармен немесе сын есімдермен анықталған шкаладағы абсолютті рейтингтерге қарағанда әлдеқайда сенімді.
Хаттама нені өзгертеді
Анықтама ретінде біз аралық бағалау хаттамасына енетін негізгі өзгерістерді 4-кестеде жинақтадық.
4-кесте: Аралық бағалау хаттамасының негізгі қадамдары
- Процестің басында шешімді аралық бағалауларға бөліңіз. (Қайталанатын пайымдаулар үшін бұл бір рет жасалады. ) 2. Мүмкіндігінше, аралық бағалаулардың «сыртқы көзқарасты» қолдануын қамтамасыз етіңіз. (Қайталанатын шешімдер үшін: салыстырмалы пайымдауларды, мүмкін болса, жағдайлар шкаласын қолданыңыз. ) 3. Талдау кезеңінде бағалауларды бір-бірінен барынша тәуелсіз ұстаңыз. 4. Шешім қабылдау жиынында әрбір бағалауды бөлек қарастырыңыз. 5. Әрбір бағалау бойынша қатысушылардың өз пайымдауларын жеке жасауын қамтамасыз етіңіз; содан кейін «бағалау-талқылау-бағалау» әдісін қолданыңыз. 6. Түпкілікті шешім қабылдау үшін интуицияны кейінге қалдырыңыз, бірақ оған тыйым салмаңыз.
Сіз мұнда алдыңғы тарауларда біз ұсынған шешім гигиенасы әдістерінің бірнешеуін байқаған боларсыз: ақпаратты реттеу, шешімді тәуелсіз бағалауларға бөлу, сыртқы көзқарасқа негізделген ортақ эталондық шеңберді қолдану және бірнеше адамның тәуелсіз пайымдауларын біріктіру. Осы әдістерді енгізу арқылы аралық бағалау хаттамасы мүмкіндігінше шешім гигиенасын енгізу үшін шешім қабылдау процесін өзгертуді көздейді.
Шешімнің мазмұнына емес, оның процесіне баса назар аудару кейбір адамдарда күмән тудыруы мүмкін. Біз сипаттағандай, зерттеу тобы мүшелері мен кеңес мүшелерінің реакциялары таңсық емес. Мазмұн — ерекше, процесс — жалпылама. Интуиция мен пайымдауды қолдану қызықты, ал процесті орындау олай емес. Жалпыға ортақ пікір бойынша, жақсы шешімдер — әсіресе ең жақсылары — ұлы көшбасшылардың көрегендігі мен шығармашылығынан туындайды. (Әсіресе, сол көшбасшы өзіміз болсақ, бұған сенгіміз келеді). Көптеген адамдар үшін «процесс» сөзі бюрократияны, қағазбастылықты және кешігуді елестетеді.
Хаттаманың барлық немесе кейбір компоненттерін енгізген компаниялар мен мемлекеттік мекемелермен жұмыс істеу тәжірибеміз бұл қауіптердің негізсіз екенін көрсетеді. Әрине, онсыз да бюрократияға батқан ұйымның шешім қабылдау процестерін күрделілендіру жағдайды жақсартпайды. Бірақ шешім гигиенасы баяу болуы міндетті емес және бюрократиялық болуы да шарт емес. Керісінше, ол бюрократияға тән «ауызбіршілікке» емес, ашық пікірталас пен талқылауға жол ашады.
Шешім гигиенасының қажеттілігі айқын. Бизнес пен мемлекеттік сектордағы көшбасшылар, әдетте, өздерінің ең үлкен және маңызды шешімдеріндегі шудан мүлдем хабарсыз. Соның салдарынан олар шуды азайту үшін ешқандай нақты шаралар қолданбайды. Бұл тұрғыда олар кадр таңдаудың жалғыз құралы ретінде құрылымдалмаған сұхбатқа сүйенетін рекрутерлерге ұқсайды: өз пайымдауларындағы шуды байқамайды, оның дұрыстығына негізсіз сенеді және оны жақсартатын процедуралардан бейхабар.
Қол жуу барлық аурудың алдын алмайды. Сол сияқты, шешім гигиенасы да барлық қателіктерден қорғамайды. Ол әрбір шешімді керемет етпейді. Бірақ қол жуу сияқты, ол көзге көрінбейтін, бірақ өте кең таралған және зиянды мәселені шешеді. Қай жерде пайымдау болса, сол жерде шу бар, және біз оны азайту құралы ретінде шешім гигиенасын ұсынамыз.
Аралық бағалау хаттамасы туралы сөз қозғағанда:
— «Бізде жұмысқа алу туралы шешім қабылдаудың құрылымдық процесі бар. Неліктен стратегиялық шешімдер үшін ондай жоқ? Қалай болғанда да, стратегиялық нұсқалар — жұмысқа үміткерлер сияқты».
— «Бұл — қиын шешім. Ол қандай аралық бағалауларға негізделуі керек? »
— «Бұл жоспар туралы біздің интуитивті, тұтас пайымдауымыз өте маңызды — бірақ оны әзірге талқыламайық. Біз сұраған бөлек бағалаулармен танысқаннан кейін интуициямыз бізге әлдеқайда жақсы қызмет ететін болады».
VI БӨЛІМ: Оңтайлы шу
1973 жылы судья Марвин Френкель қылмыстық жаза кесудегі шуды азайту үшін тұрақты күш жұмсауға шақырғанда дұрыс айтты. Оның бейресми, интуитивті шу аудиті, одан кейінгі ресми және жүйелі жұмыстар ұқсас адамдарға қатысты жазадағы негізсіз айырмашылықтарды анықтады. Бұл алшақтықтар шектен шыққан еді. Сондай-ақ олар адам шошытарлық болатын.
Бұл кітаптың көп бөлігін Френкельдің дәлелдерін жалпылау және олардың психологиялық негіздерін түсіндіру әрекеті деп түсінуге болады. Кейбір адамдар үшін қылмыстық сот төрелігі жүйесіндегі шу мүлдем төзімсіз, тіпті масқара болып көрінеді. Бірақ басқа да сансыз контексттерде жеке және мемлекеттік сектордағы бір-бірін алмастыра алатын адамдардың жұмыс барысында әртүрлі пайымдаулар жасауы да жақсы емес. Сақтандыруда, қызметкерлерді іріктеу мен бағалауда, медицинада, сот сараптамасында, білім беруде, бизнесте және үкіметте тұлғааралық шу — қателіктің негізгі көзі. Сондай-ақ, біз әрқайсымыздың «жағдайлық шуға» бейім екенімізді көрдік: маңызсыз факторлар біздің таңертең және түстен кейін, немесе дүйсенбі мен бейсенбіде әртүрлі шешім қабылдауымызға себеп болуы мүмкін.
Бірақ сот үкімдеріне арналған нұсқаулықтарға қатысты туындаған қатаң теріс реакция көрсеткендей, шуды азайту талпыныстары жиі елеулі, тіпті қызу қарсылықтарға тап болады. Көптеген адамдар бұл нұсқаулықтарды қасаң, адамгершіліктен жұрдай және өзінше әділетсіз деп санайды. Көпшілігіміз компанияға, жұмыс берушіге немесе үкіметке негізді өтінішпен барып: «Біз сізге көмектескіміз келеді, бірақ қолымыз байлаулы. Бізде нақты ережелер бар», — деген жауапты естіген болармыз. Бұл ережелер ақылға қонымсыз, тіпті қатыгез көрінуі мүмкін, бірақ олар игі мақсатпен: шуды (мүмкін, бұрмалауды (жүйелі қателіктер)) азайту үшін қабылданған болуы ықтимал.
Соған қарамастан, шуды азайтуға бағытталған кейбір талпыныстар, әсіресе адамдардың өз ісін әділ қарату мүмкіндігін шектесе, үлкен алаңдаушылық тудырады. Алгоритмдер мен машиналық оқытуды қолдану бұл мәселені жаңа қырынан көрсетті. Ешкім «Алгоритмдер жасасын! » деген ұранмен шеруге шығып жатқан жоқ.
Йель заң мектебінің өкілі Кейт Стит пен федералды судья Хосе Кабранестің сыни пікірлері үлкен ықпалға ие болды. Олар үкім кесу нұсқаулықтарына және біздің негізгі аргументтеріміздің біріне шүйлікті. Олардың уәжі тек қылмыстық жаза кесумен шектелгенімен, оны білім беру, бизнес, спорт және басқа да салалардағы шуды азайту стратегияларына қарсылық ретінде қолдануға болады. Стит пен Кабранес үкім кесу нұсқаулықтары « дискрецияны (өз қалауы бойынша шешім қабылдау еркіндігін) қолданудан қорқудан және сарапшылар мен орталықтандырылған жоспарлауға деген технократиялық сенімнен» туындаған деп есептейді. Олардың ойынша, «төрелік етуден қорқу» әр істің жеке ерекшеліктерін ескеруге кедергі келтіреді және «ешқандай механикалық шешім әділдік талаптарын қанағаттандыра алмайды».
Қарсылықтарды талдау
Бұл қарсылықтарды тереңірек қарастырған жөн. Әртүрлі шешімдер қабылданатын ортада адамдар жиі «әділдік талаптарын» кез келген механикалық шешімге қарсы қояды, бұл өз кезегінде шудың кепілді түрде болуына жол береді. Көбісі «әр істің жеке жағдайларына» назар аударуды талап етеді. Ауруханаларда, мектептерде және түрлі фирмаларда бұл үндеу интуитивті түрде қолдау табады. Біз шешім қабылдау гигиенасы (қателіктерді азайтуға бағытталған алдын алу шараларының жиынтығы) шуды азайтудың түрлі стратегияларын қамтитынын көрдік және олардың көбі механикалық шешімдерге жатпайды; адамдар мәселені құрамдас бөліктерге бөлгенде, олардың пайымдаулары механикалық болуы шарт емес. Дегенмен, көптеген адамдар шешім қабылдау гигиенасы стратегияларын қолдануды құптамайды.
Біз шуды қажетсіз өзгермелілік деп анықтадық, егер бір нәрсе қажетсіз болса, оны жою керек. Бірақ талдау бұдан да күрделірек әрі қызықтырақ. Басқа жағдайлар тең болғанда, шу қажетсіз болуы мүмкін. Бірақ басқа жағдайлар тең болмауы ықтимал және шуды жою шығындары оның пайдасынан асып түсуі мүмкін. Тіпті шығындар мен пайданы талдау шудың қымбатқа түсетінін көрсетсе де, оны жою мемлекеттік және жеке институттар үшін бірқатар жағымсыз немесе мүлдем қабылданбайтын салдарға әкелуі мүмкін.
Шуды азайту немесе жою талпыныстарына қатысты жеті негізгі қарсылық бар:
- Қымбатшылық: Шуды азайту өте қымбат болуы мүмкін; бұл жұмсалған күш-жігерге тұрмауы ықтимал. Қажетті қадамдар тым ауыр немесе кейбір жағдайларда орындалмайтын болуы мүмкін. 2. Жаңа қателіктер: Шуды азайту үшін енгізілген кейбір стратегиялар өз кезегінде басқа қателіктер тудыруы мүмкін. Кейде олар жүйелі бұрмалауға әкеледі. Егер мемлекеттік мекеменің барлық болжаушылары бірдей шындыққа жанаспайтын оптимистік болжамдарды қолданса, олардың болжамдарында шу болмайды, бірақ олар қате болады. 3. Қадір-қасиет пен құрмет: Егер біз адамдардың өздеріне құрметпен қарағанын сезінгенін қаласақ, кейбір шуға төзуге тура келуі мүмкін. Шу — кемелсіз процестің жанама өнімі болуы мүмкін, бірақ бұл процесс әр адамға (қызметкерге, клиентке, студентке) жеке тыңдау мүмкіндігін, дискрецияға әсер ету мүмкіндігін және өзінің естілгенін сезінуге жағдай жасайды. 4. Эволюцияға қажеттілік: Жаңа құндылықтарға бейімделу және моральдық-саяси эволюция үшін шу қажет болуы мүмкін. Егер шуды толық жойсақ, жаңа бағыттарға жауап беру қабілетіміз төмендеуі мүмкін. Шусыз жүйе қалыптасқан құндылықтарды қатырып тастауы ықтимал. 5. Жүйені алдау: Шуды азайтуға арналған стратегиялар адамдарды жүйенің саңылауларын іздеуге немесе тыйымдардан айналып өтуге итермелеуі мүмкін. Құқық бұзушылықтың алдын алу үшін аздаған (немесе көптеген) шу қажет болуы мүмкін. 6. Тежеу факторы: Шулы процесс жақсы тежеу құралы болуы мүмкін. Егер адамдар кішігірім немесе үлкен жазаға тартылуы мүмкін екенін білсе (әсіресе тәуекелге барғысы келмейтіндер), олар заң бұзудан аулақ болады. Жүйе қосымша тежеу құралы ретінде шуға жол беруі мүмкін. 7. Шығармашылықтың шектелуі: Адамдар өздерін машинаның кішкене бөлшегі сияқты сезінгісі келмейді. Шуды азайту стратегиялары адамдардың шығармашылығын тұншықтырып, жігерін құм қылуы мүмкін.
Біз бұл қарсылықтарды мұқият қарастырғанымызбен, оларды шуды азайтудың жалпы мақсатынан бас тартуға негіз ретінде толық қабылдамаймыз. Бір маңызды жайтты атап өту керек: қарсылықтың орындылығы оның қай стратегияға қолданылатынына байланысты. Мысалы, сіз қасаң нұсқаулықтарға қарсы бола тұра, тәуелсіз пайымдауларды біріктіруді құптай аласыз. Біздің жалпы қорытындымыз: тіпті бұл қарсылықтарды ескерген күннің өзінде, шуды азайту лайықты әрі кезек күттірмейтін мақсат болып қала береді.
26-ТАРАУ. Шуды азайтудың шығындары
Адамдардан шуды жоюды талап еткенде, олар бұл қадамдардың тым қымбат екенін алға тартуы мүмкін. Төтенше жағдайларда шуды азайту мүлдем мүмкін емес. Бұл уәжді біз бизнесте, білім беруде, үкіметте және басқа да салаларда естідік. Мұнда орынды алаңдаушылық бар, бірақ ол жиі асыра сілтеп көрсетіледі немесе жай ғана сылтау ретінде қолданылады.
Осы қарсылықтың мәнін түсіну үшін әр апта сайын оныншы сынып оқушыларының жиырма бес эссесін тексеретін мұғалімді елестетейік. Егер мұғалім әр эссеге 15 минуттан артық уақыт жұмсамаса, бағалау шулы, демек дәл емес және әділетсіз болуы мүмкін. Мұғалім шуды азайту үшін әріптесінен де тексеруді сұрауы мүмкін, сонда әр жұмысты екі адам оқиды. Немесе әр эссеге көбірек уақыт бөліп, бағалау процесін құрылымдап немесе оларды түрлі ретпен бірнеше рет оқып шығуға болады. Тіпті эсселерді күннің бір мезгілінде оқу да жағдайлық шуды (бір адамның түрлі уақытта түрлі шешім қабылдауы) азайтуға көмектесер еді.
Бірақ егер мұғалімнің өз бағалауы дәл болса және шу көп болмаса, бұлай істеудің қажеті жоқ шығар. Бұл жай ғана артық әурешілік болуы мүмкін. Мұнда тәртіпті талдау қажет: дәлдік қаншалықты артады, ол қаншалықты маңызды және оған қанша уақыт пен ақша кетеді? Университетке түсу мәселесі шешілетін бітіру жұмыстарында шуды азайтуға жұмсалатын инвестиция әлдеқайда жоғары болуы тиіс екені анық.
Бұл талдауды жеке және мемлекеттік ұйымдардың күрделі жағдайларына да қолдануға болады. Кейбір аурулар үшін ауруханалар мен дәрігерлер өзгермелілікті жоюдың қарапайым ережелерін таба алмай қиналуы мүмкін. Медициналық диагноздардағы айырмашылықтарды азайту өте маңызды, себебі бұл адам өмірін сақтап қалуы мүмкін. Бірақ бұл талпыныстардың шығындары мен мүмкіндіктерін ескеру керек. Егер диагноз қоюдағы шу шамалы болса, ал оны жою үшін жасалатын тест өте қымбат әрі қауіпті болса, онда оны барлық емделушіге міндеттеу тиімсіз болуы мүмкін.
Қызметкерлерді бағалау өмір мен өлім мәселесі болмаса да, шу әділетсіздікке және фирма үшін жоғары шығындарға әкелуі мүмкін. Шуды азайту шаралары жүзеге асырылуы мүмкін бе? Бұл соған тұра ма? Қате бағалаулар көзге түсіп, ұятты жағдайға қалдыруы мүмкін. Дегенмен, кейбір мекемелер түзету шараларына күш жұмсаудың қажеті жоқ деп есептейді. Кейде бұндай қорытынды келте ойлаушылық болып табылады. Біз шуды азайтудың пайдасын оның шығындарымен салыстыруымыз керек. Сондықтан шу аудиті (ұйымдағы шу деңгейін анықтау үшін жүргізілетін тексеріс) өте маңызды.
Шу аз, қате көп пе?
Тағы бір қарсылық — шуды азайту талпыныстарының өзі қабылданбайтын қателіктер деңгейін тудыруы мүмкін. Егер шуды азайту үшін қолданылатын құралдар тым «төпелеген» (дөрекі) болса, бұл уәж орынды. Тіпті кейбір талпыныстар бұрмалауды арттыруы мүмкін. Мысалы, Facebook немесе Twitter сияқты әлеуметтік желілер белгілі бір балағат сөздері бар барлық жазбаларды жою туралы қатаң ереже енгізсе, шу азаяды, бірақ рұқсат етілуі тиіс көптеген жазбалар да жойылып кетеді. Бұл жалған оң нәтижелер (қате анықтау) — бағытталған қателік немесе бұрмалау болып табылады.
Экономист Альберт Хиршман реформаларға қатысты үш негізгі қарсылықты атап көрсетеді: 1. Реформалар кері әсер беруі мүмкін (мәселені одан сайын ушықтырады). 2. Олар пайдасыз болуы мүмкін (ештеңені өзгертпейді). 3. Олар басқа маңызды құндылықтарға қауіп төндіреді.
Үкім кесу нұсқаулықтарына қарсы болған судьялар осы қауіпті меңзеді. Олар Вацлав Гавелдің сөзін келтірді: «Біз әлемді жай ғана шешілуі тиіс жұмбақ, пайдалану нұсқаулығы бар машина немесе компьютерге енгізіп, ерте ме, кеш пе әмбебап шешім шығаратын ақпарат жиынтығы деп санайтын менмендік сенімнен бас тартуымыз керек».
Компьютерлік шахматтың алғашқы кезеңінде бір авиакомпания жолаушыларға компьютермен ойнауды ұсынды. Төменгі деңгейде бағдарлама қарапайым ережені қолданды: мүмкіндік болған сайын қарсыластың короліне шақ бер. Бұл бағдарламада шу болған жоқ, ол әр жолы бірдей ойнады. Бірақ бұл ереже көптеген қателіктерге әкелді. Бағдарлама шахматты өте нашар ойнады. Тіпті тәжірибесіз ойыншылар да оны жеңе алды.
АҚШ-тың кейбір штаттарында қабылданған «үшінші реттен кейін шығып қалу» (three strikes and you’re out) саясатын алайық. Егер сіз үш ауыр қылмыс жасасаңыз, өмір бойына бас бостандығыңыздан айырыласыз — болды. Бұл саясат судьялардың әртүрлілігінен туындайтын шуды азайтады. Бірақ бұл жетістіктің бағасы тым жоғары болуы мүмкін. Үш рет қылмыс жасағандардың бәрін өмір бойына түрмеге жабу әділетсіздік болуы мүмкін, өйткені олардың қылмысы зорлық-зомбылықсыз болуы немесе өмірлік жағдайлары ауыр болуы мүмкін.
Шусыз, бірақ бұрмаланған алгоритмдер
Шуды азайтудың жоғары шығындары алгоритмдер мәселесінде, әсіресе «алгоритмдік бұрмалауға» қатысты жиі айтылады. Алгоритмдер шуды жояды және сонысымен тартымды көрінеді. Бірақ алгоритмдерге сену нәсілдік немесе гендерлік кемсітушілікті арттырса, бұл қабылданбайтын шығын болады.
Математик Кэти О’Нил «Математикалық жою қаруы» атты еңбегінде үлкен деректер мен алгоритмдерге сену теңсіздікті арттырып, демократияның өзіне қауіп төндіруі мүмкін екенін айтады. ProPublica зерттеуі бойынша, рецидивизм (қылмыстың қайталануы) қаупін бағалайтын COMPAS алгоритмі нәсілдік азшылықтарға қатысты қатты бұрмаланған.
Шусыз, бірақ расистік немесе сексистік алгоритм жасау өте оңай. Сотталушының терісінің түсін ескеретін алгоритм кемсітушілікке жол береді. Алгоритмдер пайымдаудағы қажетсіз өзгермелілікті жойғанымен, қабылданбайтын бұрмалауларды ішіне енгізіп жіберуі мүмкін. Негізінде, біз нәсілді немесе жынысты ескермейтін алгоритмдер жасай алуымыз керек. Бірақ ең қиын мәселе — алгоритм нәсілді немесе жынысты ашық көрсеткіш ретінде қолданбаса да, бұрмаланған нәтиже беруі мүмкін.
Біз айтқандай, алгоритмдер екі негізгі себеп бойынша біржақты (biased) болуы мүмкін. Біріншіден, ол әдейі немесе кездейсоқ түрде нәсілмен не жыныспен тығыз байланысты болжамдық факторларды қолдануы мүмкін. Мысалы, бой мен салмақ жынысқа байланысты болса, адамдардың өскен немесе тұратын жері нәсілге байланысты болуы әбден мүмкін.
Екіншіден, кемсітушілік бастапқы деректерден де туындауы мүмкін. Егер алгоритм біржақты деректер жиынтығында оқытылса, ол да біржақты болады. Қылмысты болжауға және полиция ресурстарын тиімді бөлуге арналған болжамдық полиция қызметі (қылмысты алдын ала болжау үшін деректерді талдау) алгоритмдерін қарастырайық. Егер қылмыс туралы қолданыстағы деректер белгілі бір аудандарда полицияның шамадан тыс бақылауын немесе қылмыстың кейбір түрлерінің жиі тіркелуін көрсетсе, онда шыққан алгоритмдер кемсітушілікті жалғастырады немесе ушықтырады. Оқу деректерінде біржақтылық болған кезде, әдейі немесе байқаусызда кемсітушілікті кодтайтын алгоритм жасау әбден мүмкін. Демек, алгоритм нәсілді немесе жынысты тікелей ескермесе де, ол адамдар сияқты біржақты болып шығуы мүмкін. Шын мәнінде, бұл тұрғыда алгоритмдер нашарырақ болуы мүмкін: олар шуды жойғандықтан, адам судьяларға қарағанда жүйелі түрде біржақтылық танытуы ықтимал.
Көптеген адамдар үшін басты практикалық мәселе — алгоритмнің белгілі бір топтарға әртүрлі әсер (disparate impact) (бір топқа басқаларға қарағанда пропорционалды емес теріс ықпал ету) тигізу-тигізбеуі. Әртүрлі әсерді қалай тексеру және алгоритм үшін кемсітушілік, біржақтылық немесе әділдік дегеннің не екенін қалай шешу — бұл кітаптың ауқымынан тыс жатқан өте күрделі тақырыптар.
Дегенмен, бұл мәселенің көтерілуінің өзі — алгоритмдердің адам пайымынан айқын артықшылығы. Бастапқыда біз алгоритмдердің рұқсат етілмеген деректерді ескермейтініне көз жеткізу үшін және олардың жағымсыз түрде кемсітушілік жасамайтынын тексеру үшін мұқият бағалауды ұсынамыз. Пайымдары жиі түсініксіз болатын жекелеген адамдарды дәл осындай тексеруден өткізу әлдеқайда қиын; адамдар кейде санасыз түрде және сыртқы бақылаушылар, соның ішінде құқықтық жүйе де оңай көре алмайтын жолдармен кемсітушілік жасайды. Сондықтан кейбір жағынан алгоритм адамдарға қарағанда ашық (транспарентті) бола алады.
Сөзсіз, біз шусыз, бірақ біржақты ережелердің шығындарын ескеруіміз керек сияқты, шусыз, бірақ біржақты алгоритмдердің де шығындарына назар аударуымыз қажет. Негізгі сұрақ — біз маңызды критерийлер жиынтығы бойынша нақты өмірдегі адам судьялардан жақсырақ нәтиже көрсететін алгоритмдерді жобалай аламыз ба: дәлдік пен шуды азайту, сондай-ақ кемсітушілікке жол бермеу және әділдік. Көптеген дәлелдер алгоритмдер біз таңдаған кез келген критерийлер жиынтығы бойынша адамдардан асып түсе алатынын көрсетеді. (Біз жасайды емес, жасай алады дегенімізге назар аударыңыз. ) Мысалы, 10-тарауда сипатталғандай, алгоритм кепілдік туралы шешімдер бойынша адам судьяларға қарағанда дәлірек бола алады және сонымен бірге нәсілдік кемсітушілікке адамдарға қарағанда азырақ жол береді. Сол сияқты, түйіндемелерді іріктеу алгоритмі адам мамандарға қарағанда жақсырақ және әртүрлі таланттар тобын таңдай алады.
Осы және басқа да көптеген мысалдар бұлжытпас қорытындыға әкеледі: белгісіздікке толы әлемде болжамдық алгоритм кемел болмауы мүмкін, бірақ ол шулы және жиі біржақты болатын адам пайымынан әлдеқайда аз қателік жібереді. Бұл басымдық валидтілік (жақсы алгоритмдер әрқашан дерлік жақсырақ болжайды) және кемсітушілік (жақсы алгоритмдер адам судьяларға қарағанда біржақтылығы азырақ болуы мүмкін) тұрғысынан да сақталады. Егер алгоритмдер адам сарапшыларына қарағанда аз қате жіберсе, бірақ біз интуитивті түрде адамдарға артықшылық берсек, онда біздің интуитивті талғамдарымыз мұқият тексерілуі керек.
Біздің кеңірек қорытындыларымыз қарапайым және алгоритмдер тақырыбынан әлдеқайда асып түседі. Шуды азайту стратегиялары қымбатқа түсуі мүмкін екені рас. Бірақ көп жағдайда олардың шығындары тек сылтау ғана — және шудың әділетсіздігі мен шығындарына төзуге жеткілікті себеп емес. Әрине, шуды азайтуға бағытталған күш-жігер өз қателіктерін, мүмкін біржақтылық түрінде тудыруы мүмкін. Бұл жағдайда бізде елеулі мәселе туындайды, бірақ шешім — шуды азайтудан бас тарту емес, одан да жақсырақ әдістерді ойлап табу.
Шуды азайту шығындары туралы айтатын болсақ
«Егер біз білім беру саласындағы шуды жоюға тырыссақ, бізге көп ақша жұмсауға тура келер еді. Студенттерді бағалағанда, мұғалімдер шулы болады. Бір жұмысты бес мұғалімге бағалата алмаймыз ғой».
«Егер әлеуметтік желі адам пайымына сүйенудің орнына, контекстке қарамастан белгілі бір сөздерді ешкім қолдана алмайды деп шешсе, бұл шуды жояды, бірақ сонымен бірге көптеген қателіктер тудырады. Емі ауруынан да жаман болуы мүмкін».
«Шынында да, біржақты ережелер мен алгоритмдер бар. Бірақ адамдарда да бейімділік (bias) бар. Біздің сұрағымыз: шусыз да, біржақтылығы аз да алгоритмдерді жасай аламыз ба? »
«Шуды жою қымбатқа түсуі мүмкін — бірақ бұл шығын көбіне өзін ақтайды. Шу өте әділетсіз болуы мүмкін. Егер шуды азайтудың бір әрекеті тым дөрекі болса — егер біз қабылданбайтын қатал немесе байқаусызда біржақтылық тудыратын нұсқауларға немесе ережелерге тап болсақ — біз жай ғана бас тартпауымыз керек. Біз қайтадан әрекеттенуіміз қажет».
27-ТАРАУ Қадір-қасиет
Сізге ипотека берілмеді делік. Бұл қандай да бір адам сіздің жағдайыңызды зерттегендіктен емес, банктің «сіздің несиелік рейтингіңіз бар адамдарға ипотека берілмейді» деген қатаң ережесі болғандықтан орын алды. Немесе сіздің біліктілігіңіз өте жоғары және компаниядағы сұхбат алушыға жақсы әсер қалдырдыңыз, бірақ осыдан он бес жыл бұрын есірткіге қатысты құқық бұзушылық жасағаныңыз үшін жұмысқа қабылданбадыңыз — өйткені фирмада қылмыстық жауапкершілікке тартылған кез келген адамды жұмысқа алуға қатаң тыйым салынған. Немесе сіз қылмыс жасады деп айыпталып, кепілдікпен босатудан бас тартылдыңыз; бұл нақты адамның қатысуымен өткен жеке тыңдаудан кейін емес, алгоритм сіздің сипаттамаларыңыздағы адамдардың қашу қаупі кепілдікке рұқсат етілген шектен асады деп шешкендіктен болды.
Мұндай жағдайларда көптеген адамдар қарсылық білдірер еді. Олар өздеріне жеке тұлға ретінде қарағанын қалайды. Олардың нақты жағдайларына нақты адамның қарауын қалайды. Олар жеке-дара қараудың шу тудыратынын білуі де, білмеуі де мүмкін. Бірақ егер бұл мұндай қараудың бағасы болса, олар бұл бағаны төлеуге тұрарлық деп санайды. Олар адамдарға — Жоғарғы Соттың сөзімен айтқанда — «бірегей жеке тұлға ретінде емес, бет-бейнесі жоқ, сараланбаған массаның мүшелері ретінде қарап, соқыр түрде жаза қолданылғанда» шағымдануы мүмкін (26-тарауды қараңыз).
Көптеген адамдар өздері ережелердің озбырлығы деп санайтын нәрседен еркін, жеке тыңдауды талап етеді; бұл оларға жеке тұлға ретінде қаралып жатқандығын және тиісінше құрмет көрсетіліп жатқандығын сезінуге мүмкіндік береді. Күнделікті өмірдің бір бөлігі ретінде қаралатын тиісті құқықтық рәсім (due process) (заңды құқықтарды қорғауға бағытталған ресми іс-әрекеттер жиынтығы) түсінігі шешім қабылдауға уәкілетті адам факторлардың кең ауқымын ескеретін бетпе-бет өзара әрекеттесу мүмкіндігін талап ететіндей көрінуі мүмкін.
Көптеген мәдениеттерде бұл әр жағдайды жеке қарау туралы аргументтің терең моральдық негіздері бар. Оны саясаттан, заңнан, теологиядан және тіпті әдебиеттен де табуға болады. Шекспирдің «Венеция көпесі» шығармасын шусыз ережелерге қарсылық және жалпы заңдағы және адам пайымындағы қайырымдылықтың рөлін қорғау ретінде оңай оқуға болады. Порцияның қорытынды сөзі:
Рақымдылық қасиеті мәжбүрлеуден тумайды; Ол көктен жауған жұмсақ жаңбыр сияқты, Төмендегі жерге тамшылайды. Ол екі есе берекелі; Ол бергенге де, алғанға да бақыт сыйлайды: (… ) Ол патшалардың жүрегіне орныққан, Ол — Құдайдың өз сипаты; Жердегі билік сонда Құдайға ұқсайды, Әділдікті рақыммен жұмсартқанда.
Ережелермен шектелмегендіктен, рақымдылық — шулы. Соған қарамастан, Порцияның бұл өтініші көптеген жағдайларда және сансыз ұйымдарда жасалуы мүмкін. Ол жиі қолдау табады. Қызметкер лауазымын көтеруді қалауы мүмкін. Болашақ үй иесі несие алуға өтініш беруі мүмкін. Студент университетке түсуге талпынуы мүмкін. Мұндай жағдайлар бойынша шешім қабылдаушылар шуды азайтудың кейбір стратегияларын, әсіресе қатаң ережелерді қабылдамауы мүмкін. Егер олар бас тартпаса, бұл Порция сияқты «рақымдылық қасиеті мәжбүрлеуден тумайды» деп ойлағандықтан болуы мүмкін. Олар өз әдістерінің шулы екенін білуі мүмкін, бірақ егер бұл адамдардың өздеріне құрметпен қарағанын және біреудің оларды тыңдағанын сезінуін қамтамасыз етсе, олар бәрібір соны таңдауы мүмкін.
Шуды азайтудың кейбір стратегиялары бұл қарсылыққа тап болмайды. Егер шешімді тек бір адам емес, үш адам қабылдаса, адамдарға бәрібір жеке тыңдау мүмкіндігі беріледі. Нұсқаулықтар шешім қабылдаушыларға айтарлықтай еркіндік қалдыруы мүмкін. Бірақ шуды азайтудың кейбір күш-жігері, соның ішінде қатаң ережелер, бұл еркіндікті жояды және адамдардың «бұл процесс біздің қадір-қасиетімізді қорлайды» деп наразылық білдіруіне әкелуі мүмкін.
Олардікі дұрыс па? Әрине, адамдарға жеке тыңдау мүмкіндігі берілуі жиі маңызды. Тыңдалу мүмкіндігінің сөзсіз адамгершілік құндылығы бар. Бірақ егер жеке тыңдаулар көбірек өлімге, көбірек әділетсіздікке және әлдеқайда жоғары шығындарға әкелсе, оларды дәріптеудің қажеті жоқ. Біз жұмысқа алу, оқуға қабылдау және медицина сияқты жағдайларда шуды азайтудың кейбір стратегиялары дөрекі болуы мүмкін екенін атап өттік; олар шулы болса да, жалпы алғанда аз қате жіберетін жеке-дара қарау формаларына тыйым салуы мүмкін. Бірақ егер шуды азайту стратегиясы дөрекі болса, онда біз айтқандай, ең жақсы жауап — маңызды айнымалылардың кең ауқымына бейімделген жақсырақ стратегия ойлап табуға тырысу. Ал егер сол жақсырақ стратегия шуды жойып, қателерді азайтса, ол тыңдалу мүмкіндігін азайтса немесе жойса да, жеке-дара қараудан айқын артықшылықтарға ие болады.
Біз жеке-дара қарауға деген қызығушылық маңызды емес деп айтып отырған жоқпыз. Бірақ мұндай қарау барлық жағымсыз салдарға, соның ішінде айқын әділетсіздікке әкелетін болса, оның бағасы тым жоғары болады.
Құндылықтардың өзгеруі
Мемлекеттік мекеменің шуды жоюға қол жеткізгенін елестетіңіз. Айталық, университет тәртіп бұзушылықты әрбір оқытушы мен әрбір студент оған не кіретінін және не кірмейтінін білетіндей етіп анықтады. Немесе ірі фирма жемқорлықтың не екенін нақты көрсетті, сондықтан фирмадағы кез келген адам неге рұқсат етілгенін және неге тыйым салынғанын біледі. Немесе жеке мекеме шуды айтарлықтай азайтып, мүмкін белгілі бір пәндер бойынша мамандығы жоқ адамдарды жұмысқа алмаймыз деді. Ұйымның құндылықтары өзгерсе не болады? Кейбір шуды азайту стратегиялары оларға орын бере алмайтын сияқты көрінеді және олардың икемсіздігі жеке-дара қарау мен қадір-қасиетке деген қызығушылықпен тығыз байланысты мәселеге айналуы мүмкін.
Американың конституциялық құқығындағы танымал бір шешім бұл мәселені түсінуге көмектеседі. 1974 жылы қабылданған бұл іс мектеп жүйесінің жүкті мұғалімдерді бала туудың болжамды күнінен бес ай бұрын ақысыз демалысқа шығуын талап ететін қатаң ережесіне қатысты болды. Мұғалім Джо Кэрол ЛаФлер өзінің сабақ беруге толықтай жарамды екенін, бұл ереженің кемсітушілік екенін және бес айлық мерзімнің тым көп екенін алға тартты.
АҚШ Жоғарғы Соты мұнымен келісті. Бірақ ол жыныстық кемсітушілік туралы айтқан жоқ және бес айдың міндетті түрде көп екенін де айтпады. Оның орнына сот ЛаФлерге өзінің жұмысын тоқтатуға физикалық қажеттілік жоқ екенін дәлелдеуге мүмкіндік берілмегеніне қарсы болды. Соттың өз сөзімен айтқанда:
«мұғалімнің дәрігері немесе мектеп кеңесі тарапынан нақты мұғалімнің жұмысын жалғастыру қабілетіне қатысты жеке анықтама жасалмаған. Ережелерде физикалық қабілетсіздіктің теріске шығарылмайтын презумпциясы (алдын ала қабылданған және өзгертілмейтін жорамал) бар және бұл жорамал тіпті жеке әйелдің физикалық жағдайы туралы медициналық айғақтар мүлдем керісінше болса да қолданылады».
Бес айлық міндетті демалыс кезеңі шынымен ақылға қонымсыз көрінеді. Бірақ сот бұл жайтқа баса назар аударған жоқ. Оның орнына ол «теріске шығарылмайтын презумпцияға» және «жеке анықтаманың» болмауына шағымданды. Бұлай деу арқылы сот Порция сияқты рақымдылық қасиеті мәжбүрлеуден тумайтынын және ЛаФлердің нақты жағдайына нақты адамның қарауы қажет екенін айтқандай болды.
Бірақ шешім гигиенасынсыз бұл шудың көзі болып табылады. ЛаФлердің ісін кім шешеді? Ол үшін қабылданған шешім дәл сондай жағдайдағы басқа көптеген әйелдер үшін де бірдей бола ма? Қалай болғанда да, көптеген ережелер теріске шығарылмайтын презумпцияларға тең келеді. Белгіленген жылдамдық шегі қабылданбайды ма? Дауыс беру немесе ішімдік ішу үшін ең төменгі жас шегі ше? Мас күйінде көлік жүргізуге толық тыйым салу ше? Осындай мысалдарды ескере отырып, сыншылар «теріске шығарылмайтын презумпцияларға» қарсы аргумент тым көп нәрсені жоққа шығарады деп қарсылық білдірді — өйткені олардың мақсаты мен нәтижесі шуды азайту болып табылады.
Сол кездегі ықпалды комментаторлар моральдық құндылықтар уақыт өте келе өзгеретінін, сондықтан қатал ережелерден аулақ болу қажеттілігін алға тартып, соттың шешімін қорғады. Олар әйелдердің қоғамдағы рөліне қатысты әлеуметтік нормалардың үлкен өзгеріс үстінде екенін айтты. Олар жеке анықтамалар бұл контекстте өте қолайлы екенін, өйткені олар сол өзгермелі нормаларды ескеруге мүмкіндік беретінін алға тартты. Ережеге негізделген жүйе шуды жоюы мүмкін, бұл жақсы, бірақ ол бар нормалар мен құндылықтарды «қатырып» тастауы мүмкін, бұл онша жақсы емес.
Қорыта айтқанда, кейбір адамдар шулы жүйенің артықшылығы ретінде оның жаңа және туындап жатқан құндылықтарға бейімделуге мүмкіндік беретінін айтуы мүмкін. Құндылықтар өзгерген сайын және судьяларға еркіндік берілсе, олар, мысалы, есірткіге қатысты қылмыс жасағандарға жеңілірек жаза, ал зорлық-зомбылық жасағандарға қатаңдау жаза бере бастауы мүмкін. Біз егер кейбір судьялар жұмсақ, ал басқалары қатал болса, онда әділетсіздік деңгейі болатынын атап өттік; ұқсас жағдайдағы адамдарға әртүрлі қаралады. Бірақ егер әділетсіздік жаңа немесе туындап жатқан әлеуметтік құндылықтарға орын қалдырса, оған төзуге болады.
Бұл мәселе тек қылмыстық сот төрелігі жүйесімен немесе заңмен ғана шектелмейді. Кез келген саясатқа қатысты компаниялар шу тудырса да, өз пайымдары мен шешімдерінде икемділікке жол беруді шешуі мүмкін, өйткені икемділік жаңа сенімдер мен құндылықтар пайда болған сайын, уақыт өте келе саясатты өзгертуге мүмкіндік береді. Біз жеке мысал келтірейік: біздің біреуіміз осыдан бірнеше жыл бұрын ірі консалтингтік фирмаға жұмысқа орналасқанда, ол алған «қош келдіңіз» топтамасында өтемақы төленетін жол жүру шығындары көрсетілген («аман-есен жеткенде үйге бір рет телефон соғу; костюмді үтіктету шығыны; қонақүй қызметшілеріне шайпұл»). Ережелер шусыз болды, бірақ анық ескірген (және сексистік) еді. Олар көп ұзамай уақыт талабына сай дами алатын стандарттармен ауыстырылды. Мысалы, қазір шығындар «тиісті және негізді» болуы керек.
Шуды бұлай қорғауға берілетін бірінші жауап қарапайым: шуды азайтудың кейбір стратегиялары бұл қарсылыққа мүлдем тап болмайды. Егер адамдар сыртқы көзқарасқа негізделген ортақ шкаланы қолданса, олар уақыт өте келе өзгеретін құндылықтарға жауап бере алады. Қалай болғанда да, шуды азайту күш-жігері тұрақты болмауы керек және болмауы тиіс. Егер мұндай күш-жігер қатаң ережелер түрінде болса, оларды жасаушылар уақыт өте келе өзгерістер енгізуге дайын болуы керек. Олар оларды жыл сайын қайта қарауы мүмкін. Жаңа құндылықтарға байланысты жаңа ережелердің қажет екенін шешуі мүмкін. Қылмыстық сот төрелігі жүйесінде ереже шығарушылар кейбір қылмыстар үшін жазаны азайтып, басқалары үшін арттыруы мүмкін. Олар кейбір әрекеттерді мүлдем декриминализациялауы мүмкін, ал бұрын толықтай қолайлы деп саналған әрекетті қылмыс деп тануы мүмкін.
Бірақ сәл артқа шегінейік. Шулы жүйелер жаңадан пайда болған моральдық құндылықтарға орын бере алады және бұл жақсы нәрсе болуы мүмкін. Бірақ көптеген салаларда шудың жоғары деңгейін бұл аргументпен қорғау ақылға қонымсыз. Шуды азайтудың ең маңызды стратегияларының бірі — пайымдарды біріктіру (агрегация), ол жаңа құндылықтарды ескеруге мүмкіндік береді. Егер бұзылған ноутбукке шағымданған әртүрлі тұтынушыларға компьютерлік компания әртүрлі қараса, бұл сәйкессіздік жаңа құндылықтарға байланысты болуы екіталай. Егер әртүрлі адамдар әртүрлі медициналық диагноздар алса, бұл сирек жағдайда жаңа моральдық құндылықтарға байланысты болады. Біз құндылықтардың дамуына мүмкіндік беретін процестерді жобалай отырып, шуды азайту немесе тіпті жою үшін көп нәрсе істей аламыз.
Жүйені алдау, ережелерден жалтару
Шулы жүйеде кез келген түрдегі төрешілер жағдай талап еткендей бейімделе алады — және күтпеген оқиғаларға жауап бере алады. Бейімделу мүмкіндігін жою арқылы шуды азайтудың кейбір стратегиялары адамдарды жүйені алдауға (game the system) итермелейтін күтпеген салдарға әкелуі мүмкін. Шуға төзудің ықтимал аргументі — ол жеке және мемлекеттік мекемелердің мұндай алдаудың алдын алу үшін қолданатын әдістерінің жанама өнімі болуы мүмкін.
Салық кодексі — танымал мысал. Бір жағынан, салық жүйесі шулы болмауы керек. Ол түсінікті және болжамды болуы тиіс; бірдей салық төлеушілерге әртүрлі қарамау керек. Бірақ егер біз салық жүйесіндегі шуды жойсақ, тапқыр салық төлеушілер міндетті түрде ережелерден жалтарудың жолын табады. Салық мамандарының арасында шуды жоятын нақты ережелердің болғаны жақсы ма, әлде болжап болмайтындыққа жол беретін, бірақ сонымен бірге нақты ережелердің пайдакүнемдік немесе жеке мүдделі мінез-құлық тудыру қаупін азайтатын белгілі бір дәрежедегі бұлыңғырлықтың болғаны жақсы ма деген қызу пікірталас жүріп жатыр.
Кейбір компаниялар мен университеттер адамдарға не екенін нақты көрсетпестен «теріс қылық» жасауға тыйым салады. Мұның бұлжытпас нәтижесі — шу, бұл жақсы емес және тіпті өте жаман болуы мүмкін. Бірақ егер теріс қылық болып саналатын нәрселердің нақты тізімі болса, онда тізімде тікелей қамтылмаған сұмдық әрекеттерге төзімділік танытылуы мүмкін.
Ережелердің нақты шекаралары болғандықтан, адамдар техникалық тұрғыдан босатылған, бірақ сондай немесе ұқсас зиян келтіретін әрекеттер жасау арқылы олардан жалтара алады. (Жасөспірім баласы бар әрбір ата-ана мұны біледі! ) Біз тыйым салынуы тиіс барлық әрекеттерді қамтитын ережелерді оңай жобалай алмаған кезде, бізде шуға төзудің өзіндік себебі болады — немесе қарсылық осылай айтылады.
Кейбір жағдайларда шуды жоятын нақты, анықталған ережелер шынымен де жалтару қаупін тудырады. Және бұл қауіп шуды азайтудың агрегация сияқты басқа стратегиясын қабылдауға және мүмкін белгілі бір шуға жол беретін әдіске төзуге себеп болуы мүмкін. Бірақ болуы мүмкін деген сөздер өте маңызды. Біз қаншалықты жалтару болатынын және қаншалықты шу болатынын сұрауымыз керек. Егер жалтару аз, ал шу көп болса, онда шуды азайтатын әдістер бізге тиімдірек. Біз бұл сұраққа 28-тарауда ораламыз.
Тежеу және тәуекелден қашу
Айталық, мақсат — қызметкерлердің, студенттердің немесе қарапайым азаматтардың тарапынан болатын теріс қылықтарды тежеу (deterrence). Сәл болжап болмайтындық немесе тіпті оның көп болуы ең нашар нәрсе болмауы мүмкін. Жұмыс беруші: «Егер теріс қылықтың белгілі бір түрлері үшін жаза айыппұл, жұмыстан шеттету немесе жұмыстан шығару болса, онда менің қызметкерлерім мұндай әрекеттерге бармайды», — деп ойлауы мүмкін. Қылмыстық сот төрелігі жүйесін басқарушылар: «Егер болашақ қылмыскерлер ықтимал жаза туралы болжам жасауға мәжбүр болса, біз оған аса қарсы емеспіз. Егер жаза лотереясының перспективасы адамдарды шектен шығудан тоқтатса, мүмкін содан туындайтын шуға төзуге болар», — деп ойлауы мүмкін.
Абстрактілі түрде бұл аргументтерді жоққа шығаруға болмайды, бірақ олар аса сенімді емес. Бір қарағанда, маңыздысы — жазаның күтілетін құны, ал 5 000 доллар айппұлдың 50% мүмкіндігі 2 500 доллар айыппұлдың нақтылығына тең. Әрине, кейбір адамдар ең нашар сценарийге назар аударуы мүмкін. Тәуекелден қашатын (risk-averse) (шығыннан қорығу үрдісі бар) адамдарды 5 000 доллар айыппұлдың 50% мүмкіндігі көбірек тежеуі мүмкін — бірақ тәуекелге құмар адамдарды бұл азырақ тежейді. Шулы жүйенің көбірек тежеу күшіне ие екенін білу үшін, біз әлеуетті құқық бұзушылардың тәуекелден қашатынын немесе тәуекелге құмар екенін білуіміз керек. Егер біз тежеуді күшейткіміз келсе, жазаны арттырып, шуды жойған дұрыс емес пе? Бұл әділетсіздікті де жояр еді.
Шығармашылық, рух және тың идеялар
Шуды азайтуға бағытталған кейбір талпыныстар мотивация мен жұмысқа деген ынтаны басып тастауы мүмкін бе? Олар шығармашылыққа әсер етіп, адамдардың үлкен серпіліс жасауына кедергі келтіруі мүмкін бе? Көптеген ұйымдар солай деп ойлайды. Кей жағдайларда олардікі дұрыс та болар. Осыны анықтау үшін олар нақты қандай шуды азайту стратегиясына қарсы шығып жатқанын нақтылауымыз керек.
Көптеген судьялардың үкім кесу бойынша нұсқаулықтарға көрсеткен аса теріс реакциясын еске түсіріңізші. Бір судья айтқандай: «Біз сот залында шешім қабылдау құқығына сенуді қайта үйренуіміз керек». Жалпы алғанда, билік басындағы адамдар өздерінің дискрециясының (лауазымды тұлғаның өз қалауы бойынша шешім қабылдау еркіндігі) шектелгенін ұнатпайды. Олар өздерін төмендетілгендей, шектелгендей, тіпті қорланғандай сезінуі мүмкін. Олардың шешім қабылдау еркіндігін азайту үшін қадамдар жасалғанда, көбі қарсы шығады. Олар төрелік ету мүмкіндігін бағалайды, тіпті оны қастерлеуі де мүмкін. Егер олардың еркіндігі тартып алынып, басқалар істегенді ғана істеуге мәжбүр болса, олар өздерін машинадағы кішкентай тетіктер сияқты сезінуі мүмкін.
Қысқасы, шулы жүйе моральдық рух үшін шулы болғаны үшін емес, адамдарға өздері дұрыс деп санағандай шешім қабылдауға мүмкіндік бергені үшін тиімді болуы мүмкін. Егер қызметкерлерге клиенттердің шағымдарына өз қалауынша жауап беруге, қол астындағыларды өздері дұрыс деп санағандай бағалауға немесе сыйақыларды тиісті деп тапқандай белгілеуге рұқсат берілсе, олар өз жұмыстарынан көбірек ләззат алуы мүмкін. Егер компания шуды жою үшін қадамдар жасаса, қызметкерлер өздерінің жеке ерік-жігеріне нұқсан келді деп ойлауы мүмкін. Енді олар өз шығармашылығын қолданудың орнына, жай ғана ережелерді орындап жүр. Олардың жұмысы механикалық, тіпті роботтық сипатқа ие болады. Өз бетіңше шешім қабылдау қабілетіңді тұншықтыратын жерде кім жұмыс істегісі келеді?
Ұйымдар бұл сезімдерге тек оларды құрметтегендіктен ғана емес, сонымен қатар адамдарға жаңа идеялар ойлап табуға кеңістік бергісі келгендіктен де назар аударуы мүмкін. Егер қатаң ереже болса, ол тапқырлық пен жаңашылдықты азайтуы мүмкін.
Бұл жайттар ұйымдардағы көптеген адамдарға қатысты, бірақ, әрине, бәріне емес. Әртүрлі тапсырмалар әртүрлі бағалануы тиіс; тамақ ауруы немесе гипертонияны диагностикалаудағы шулы шешімдер шығармашылықты шыңдайтын жақсы орын емес шығар. Бірақ егер бұл жұмыс күшін бақыттырақ әрі шабыттырақ етсе, біз шуға төзуге дайын болуымыз мүмкін. Моральдық рухтың түсуінің өзі — шығын және ол нашар өнімділік сияқты басқа да шығындарға әкеледі. Әрине, біз жаңа идеяларға ашық бола отырып, шуды азайта алуымыз керек. Күрделі пайымдауларды құрылымдау сияқты кейбір шуды азайту стратегиялары дәл осыны істейді. Егер біз моральдық рухты сақтай отырып, шуды азайтқымыз келсе, сондай нәтиже беретін шешім гигиенасы (қателіктерді болдырмауға бағытталған алдын алу шаралары) стратегияларын таңдауымыз мүмкін. Ал басшылық тіпті қатаң ережелер болған күннің өзінде, оларды қайта қарау және күмән келтіру процесі бар екенін, бірақ әр жағдайда жеке еркіндік пайдалану арқылы оларды бұзуға болмайтынын түсіндіре алады.
Белгілі заңгер әрі ойшыл Филип Ховард өзінің бірқатар жігерлі кітаптарында икемді пайымдауларға жол беруді қолдайтын ұқсас пікірлер айтады. Ховард саясаттың шуды жоятын нұсқаулық ережелер емес, «парасатты болыңыз», «ұстамды әрекет етіңіз», «артық қауіп төндірмеңіз» деген сияқты жалпы принциптер түрінде болғанын қалайды.
Ховардтың пайымдауынша, мемлекеттік реттеудің заманауи әлемі тым қатал болғандықтан ақылға сыйымсыз болып кеткен. Мұғалімдер, фермерлер, құрылысшылар, медбикелер, дәрігерлер — осы сарапшылардың барлығы не істеу керектігін және оны қалай істеу керектігін нақты айтып тұратын ережелердің қыспағында қалған. Ховардтың ойынша, мақсаттарға (мейлі ол білім беру сапасын арттыру, жазатайым оқиғаларды азайту, таза су немесе дені сау пациенттер болсын) қалай қол жеткізу керектігін адамдардың өз шығармашылығына қалдыру әлдеқайда тиімді болар еді.
Ховард тартымды дәлелдер келтіреді, бірақ ол қолдайтын тәсілдердің салдары, соның ішінде шу мен бейімділіктің ықтимал өсуі туралы сұрау маңызды. Көптеген адамдар қаталдықты ұната бермейді, бірақ бұл шуды азайтудың және бейімділік пен қателікті жоюдың ең жақсы жолы болуы мүмкін. Егер тек жалпы принциптер ғана болса, оларды түсіндіру мен орындауда шу пайда болады. Бұл шу төзіп болмайтын, тіпті масқара деңгейде болуы мүмкін. Кем дегенде, шудың шығындары мұқият ескерілуі керек — бірақ әдетте олай істелмейді. Шудың жаппай әділетсіздік пен үлкен шығындар әкелетінін көргеннен кейін, біз оның қабылданбайтынын және маңызды құндылықтарға нұқсан келтірмейтін шуды азайту стратегияларын анықтау керектігін түсінеміз.
Қадір-қасиет туралы айтар болсақ
«Адамдар бетпе-бет сөйлесуді бағалайды, тіпті оған мұқтаж. Олар өздерінің уайымдары мен шағымдарын нағыз адам тыңдағанын және оның жағдайды жақсартуға билігі болғанын қалайды. Әрине, мұндай қарым-қатынастар еріксіз шу тудырады. Бірақ адамның қадір-қасиеті баға жетпес құндылық».
«Моральдық құндылықтар үнемі өзгеріп отырады. Егер біз бәрін құлыптап тастасақ, өзгермелі құндылықтарға орын қалмайды. Шуды азайтуға бағытталған кейбір талпыныстар тым қатал; олар моральдық өзгерістерге кедергі келтіреді».
«Егер сіз заңсыздықты тоқтатқыңыз келсе, кейбір шуларға төзуіңіз керек. Егер студенттер плагиат үшін қандай жаза боларын нақты білмей күмәнданса, бұл жақсы — олар плагиаттан аулақ болады. Шу түріндегі аздаған белгісіздік тежеуші күшті арттыруы мүмкін».
«Егер біз шуды жойсақ, соңында нақты ережелерге ие боламыз, ал қылмыскерлер одан жалтарудың жолдарын тауып алады. Егер шу стратегиялық немесе оппортунистік мінез-құлықтың алдын алудың жолы болса, ол төлеуге тұрарлық құн болуы мүмкін».
«Шығармашыл адамдарға кеңістік керек. Адамдар робот емес. Жұмысыңыз қандай болса да, сіз әрекет етуге еркіндік алуға лайықтысыз. Егер сізді жан-жақтан қысып тастаса, сіз шу шығармассыз, бірақ жұмыстан ләззат алмайсыз және өзіндік идеяларыңызды жүзеге асыра алмайсыз».
«Ақырында, шуды қорғауға бағытталған талпыныстардың көбі сенімсіз. Біз адамдардың қадір-қасиетін құрметтей аламыз, моральдық эволюцияға жеткілікті орын қалдыра аламыз және шудың әділетсіздігі мен шығынына жол бермей-ақ адам шығармашылығына мүмкіндік бере аламыз».
28-тарау. Ережелер ме, әлде стандарттар ма?
Егер мақсат шуды азайту немесе оны қалай және істеу керек пе (және қандай деңгейде) дегенді шешу болса, мінез-құлықты реттеудің екі жолын ажыратып алу пайдалы: ережелер және стандарттар . Барлық түрдегі ұйымдар көбінесе осы екеуінің бірін немесе екеуінің комбинациясын таңдайды.
Бизнесте компания қызметкерлер жұмыста белгіленген сағаттар аралығында болуы керек, ешкім екі аптадан артық демалыс ала алмайды және егер біреу баспасөзге ақпарат жариялап жіберсе, ол жұмыстан шығарылады деп айтуы мүмкін. Немесе ол қызметкерлер жұмыста «қисынды жұмыс күні» бойы болуы керек, демалыстар «фирманың қажеттіліктеріне сәйкес әр жағдайға байланысты жеке» шешіледі және ақпаратты жариялау «тиісінше жазаланады» деп айтуы мүмкін.
Заңда ереже бойынша ешкім белгіленген жылдамдық шегінен аспауы керек, жұмысшылар канцерогендердің әсеріне ұшырамауы тиіс немесе барлық рецептілік дәрі-дәрмектер арнайы ескертулермен бірге жүруі керек деп айтылуы мүмкін. Керісінше, стандарт бойынша адамдар көлікті «ұстамды» жүргізуі керек, жұмыс берушілер «мүмкіндігінше» қауіпсіз жұмыс орындарын қамтамасыз етуі керек немесе дәрі-дәрмектерге ескертулер беру-бермеуді шешкенде компаниялар «парасатты» әрекет етуі керек деп айтылуы мүмкін.
Бұл мысалдар ережелер мен стандарттар арасындағы негізгі айырмашылықты көрсетеді. Ережелер оларды қолданатындардың еркін шешім қабылдау мүмкіндігін жоюға арналған; стандарттар мұндай еркіндікті беруге арналған. Ережелер бар жерде шу айтарлықтай азаюы тиіс. Ережелерді түсіндіретіндер нақты сұраққа жауап беруі керек: Жүргізуші қандай жылдамдықпен жүрді? Жұмысшы канцероген әсеріне ұшырады ма? Дәріде қажетті ескертулер болды ма?
Ережелер бойынша фактілерді анықтау процесінің өзі пайымдауды қажет етіп, шу тудыруы немесе бейімділіктің әсеріне ұшырауы мүмкін. Біз бұған көптеген мысалдар келтірдік. Бірақ ережелерді жасаушылар бұл тәуекелдерді азайтуға тырысады және ереже саннан тұрса («он сегіз жасқа толмаған ешкім дауыс бере алмайды» немесе «жылдамдық шегі сағатына алпыс бес миль»), шу азаюы керек. Ережелердің маңызды ерекшелігі бар: олар пайымдаудың рөлін азайтады. Бұл тұрғыда, кем дегенде, судьялардың (бұл жерде ережелерді қолданатын барлық адамдар ескеріледі) жұмысы азаяды. Олар ережелерді орындайды. Жақсы болсын, жаман болсын, олардың еркін әрекет етуіне орын өте аз.
Стандарттар мүлдем басқаша. Стандарттар қолданылғанда, судьялар мағынасы ашық терминдерді нақтылау үшін көп жұмыс істеуі керек. Оларға не нәрсе (мысалы) «парасатты» және «мүмкін» деп саналатынын шешу үшін көптеген пайымдаулар жасауға тура келуі мүмкін. Фактілерді анықтаумен қатар, олар бұлыңғыр тіркестерге мазмұн беруі тиіс. Стандарттарды ойлап тапқандар шешім қабылдау өкілеттігін басқаларға береді. Олар билікті тапсырады (делегациялайды).
22-тарауда талқыланған нұсқаулықтар ережелер де, стандарттар да болуы мүмкін. Егер олар ережелер болса, олар пайымдауды қатты шектейді. Егер олар стандарттар болса да, олар еркін болмауы мүмкін. Апгар шкаласы — бұл ереже емес, нұсқаулық. Олар шешім қабылдау еркіндігіне тыйым салмайды. Нұсқаулықтар сол еркіндікті жою үшін қатайтылған кезде, олар ережеге айналады. Алгоритмдер стандарт емес, ереже ретінде жұмыс істейді.
Бөліну мен білімсіздік
Фирмалар, ұйымдар, қоғамдар немесе топтар арасында пікір қайшылығы болған кезде, ережелерден гөрі стандарттарды жасау әлдеқайда оңай екені анық. Компания басшылары менеджерлердің дөрекі әрекет етпеуі керектігіне келісе алады, бірақ бұл тыйымның нақты нені білдіретінін білмеуі мүмкін. Менеджерлер жұмыс орнындағы жыныстық қысым көрсетуге қарсы болуы мүмкін, бірақ флирт жасаудың қабылдану-қабылданбауын шешпеуі мүмкін. Университет студенттерге плагиатпен айналысуға тыйым салуы мүмкін, бірақ бұл терминнің нақты мағынасын көрсетпеуі мүмкін. Адамдар конституция сөз бостандығын қорғауы керек дегенге келісе алады, бірақ оның коммерциялық жарнаманы, қоқан-лоққыны немесе әдепсіздікті қорғау-қорғамауын шешпеуі мүмкін. Адамдар экологиялық реттеушілер парниктік газдарды азайту үшін ұстамды ережелер шығаруы керек дегенге келісе алады, бірақ ұстамдылықтың не екенін анықтамауы мүмкін.
Мәліметтерді нақтыламай стандарттарды белгілеу шуға әкелуі мүмкін, бірақ бұл шуды біз талқылаған стратегиялар (мысалы, пайымдауларды біріктіру және делдалдық бағалау хаттамасын қолдану) арқылы бақылауға болады. Басшылар ережелер шығарғысы келуі мүмкін, бірақ іс жүзінде олар бойынша келісімге келе алмауы мүмкін. Конституциялардың өзі көптеген стандарттарды қамтиды (мысалы, дін бостандығын қорғау). Адам құқықтарының жалпыға бірдей декларациясы туралы да осыны айтуға болады («Барлық адамдар өз қадір-қасиеті мен құқықтарында еркін және тең болып туылады»).
Әртүрлі адамдарды шуды азайтатын ережелер бойынша келістірудің қиындығы — ережелердің орнына стандарттардың қойылуының бір себебі. Компания басшылары қызметкерлердің клиенттермен қалай қарым-қатынас жасауы керектігін реттейтін нақты сөздер бойынша келісе алмауы мүмкін. Стандарттар мұндай басшылар жасай алатын ең жақсы нәрсе болуы мүмкін. Мемлекеттік секторда да осыған ұқсас жағдайлар бар. Заң шығарушылар стандарт бойынша компромисске келуі мүмкін (және содан туындайтын шуға төзеді), егер бұл заң қабылдаудың жалғыз жолы болса. Медицинада дәрігерлер ауруларды диагностикалау стандарттары бойынша келісе алады; ал ережелерді жасау әрекеттері шешілмейтін келіспеушіліктер тудыруы мүмкін.
Бірақ әлеуметтік және саяси бөлінулер адамдардың ереже емес, стандарттарға жүгінуінің жалғыз себебі емес. Кейде нағыз мәселе — адамдарда ақылға қонымды ережелер шығаруға мүмкіндік беретін ақпараттың жоқтығында. Университет оқытушының лауазымын көтеру туралы шешімдерін реттейтін ережелер шығара алмауы мүмкін. Жұмыс беруші қызметкерлерді жұмыста қалдыруға немесе жазалауға әкелетін барлық жағдайларды алдын ала болжай алмауы мүмкін. Ұлттық заң шығарушы орган ауаның ластануының (қатты бөлшектер, озон, азот диоксиді, қорғасын) тиісті деңгейін білмеуі мүмкін. Оның қолынан келетін ең жақсы нәрсе — қандай да бір стандарт шығару және оның мағынасын нақтылауды сенімді сарапшыларға тапсыру, тіпті оның салдары шу болса да.
Ережелер көп жағынан бейімді болуы мүмкін. Ереже әйелдерге полиция қызметкері болуға тыйым салуы мүмкін. Ол «ирландықтар қабылданбайды» деп айтуы мүмкін. Үлкен бейімділік тудырса да, ережелер шуды айтарлықтай азайтады (егер бәрі оларды орындаса). Егер ереже жиырма бір жастан асқандардың бәріне алкогольдік ішімдіктер сатып алуға рұқсат етіледі, ал одан кішілерге болмайды десе, онда шу өте аз болады. Керісінше, стандарттар шуды шақырады.
Бастықтар, бағыныштыларды бақылау
Ережелер мен стандарттар арасындағы айырмашылық барлық мемлекеттік және жеке институттар, соның ішінде бизнестің барлық түрлері үшін үлкен маңызға ие. Бұл таңдау негізгі тұлға (принципал) агентті бақылауға тырысқанда туындайды. 2-тарауда сипатталғандай, сақтандыру андеррайтерлері өз компаниясына пайда әкелу үшін «алтын орта» сыйақысын (тым жоғары да емес, тым төмен де емес) белгілеуге тырысады. Олардың бастықтары бұл андеррайтерлерге бағыт-бағдар беру үшін стандарттар бере ме, әлде ережелер ме? Компаниядағы кез келген басшы қызметкерлерге өте нақты нұсқау беруі мүмкін немесе жалпылама айтуы мүмкін («өз ақылыңды қолдан» немесе «ең жақсы пайымдауыңды пайдалан»). Дәрігер пациентке нұсқау бергенде екі тәсілдің бірін қолдануы мүмкін. «Күн сайын таңертең және кешке бір таблетка ішіңіз» — бұл ереже; «қажет деп сезінгенде бір таблетка ішіңіз» — бұл стандарт.
Біз Facebook сияқты әлеуметтік медиа компаниясының шу мен оны қалай азайту мәселесіне еріксіз алаңдайтынын атап өттік. Компания өз қызметкерлеріне пост нақты ережені бұзғанда (мысалы, жалаңаштыққа тыйым салу) мазмұнды алып тастауды бұйыруы мүмкін. Немесе ол қызметкерлерге стандартты орындауды (мысалы, қорлауға немесе анық қорлайтын материалдарға тыйым салу) айтуы мүмкін. Facebook-тің 2018 жылы алғаш рет жарияланған «Қоғамдастық стандарттары» — бұл ережелер мен стандарттардың қызықты қоспасы. Олар жарияланғаннан кейін Facebook пайдаланушылары тарапынан компания стандарттары шектен тыс шу тудырады (сондықтан қателіктер мен әділетсіздікке әкеледі) деген көптеген шағымдар түсті. Жиі айтылатын алаңдаушылық — Facebook-тің мыңдаған модераторлары шешім қабылдауы керек болғандықтан, шешімдер әртүрлі болуы мүмкін. Посттарды алып тастау-тастамауды шешкенде, модераторлар ненің рұқсат етілгені және ненің тыйым салынғаны туралы әртүрлі шешімдер қабылдады. Мұндай ауытқудың неліктен еріксіз екенін түсіну үшін Facebook-тің 2020 жылғы Қоғамдастық стандарттарындағы мына сөздерді қараңыз:
Біз өшпенділік тілін адамдарға олардың қорғалатын сипаттамаларына — нәсіліне, этникалық тегіне, ұлттық шығу тегіне, діни сеніміне, жыныстық бағытына, кастасына, жынысына, гендерлік сәйкестігіне және ауыр сырқатына немесе мүгедектігіне негізделген тікелей шабуыл деп анықтаймыз. Біз сондай-ақ иммиграциялық мәртебе үшін де кейбір қорғауларды қамтамасыз етеміз. Біз шабуылды зорлық-зомбылық немесе адамдық қасиетті қорлайтын сөздер, төмендігі туралы мәлімдемелер немесе шеттету мен сегрегацияға шақырулар деп анықтаймыз.
Мұндай анықтаманы іске асыру кезінде модераторлардың шешімдері міндетті түрде шулы болады. Нақты не нәрсе «зорлық-зомбылық немесе адамдық қасиетті қорлайтын сөз» деп саналады? Facebook мұндай сұрақтардан хабардар болды және оларға жауап ретінде шуды азайту үшін нақты ережелерге көшті. Бұл ережелер «The New Yorker» журналы қол жеткізген, шамамен он екі мың сөзден тұратын «Іске асыру стандарттары» деп аталатын жабық құжатта тізілген. Жарияланған Қоғамдастық стандарттарында қатал мазмұнды реттейтін мәтін: «Біз зорлық-зомбылықты дәріптейтін мазмұнды алып тастаймыз» деген стандарттан басталған. (Бұл нақты нені білдіреді? ) Керісінше, Іске асыру стандарттарында қатал суреттер тізіліп, мазмұн модераторларына бұл суреттермен не істеу керектігі нақты айтылған. Мысалдарға «күйген немесе өртеніп жатқан адамдар» және «дене мүшелерінің бөлініп қалуы» жатты. Күрделі тарихты қысқартсақ, Қоғамдастық стандарттары көбіне стандарттарға ұқсайды, ал Іске асыру стандарттары көбіне ережелерге ұқсайды.
Осыған ұқсас, әуе компаниясы өз ұшқыштарынан ережелерді немесе стандарттарды сақтауды сұрауы мүмкін. Сұрақ ұшу-қону жолағында тоқтап тұрғаннан кейін тоқсан минуттан соң қақпаға қайту керек пе, әлде қауіпсіздік белдігін нақты қашан қосу керек дегенде туындауы мүмкін. Әуе компаниясы ережелерді ұнатуы мүмкін, өйткені олар ұшқыштардың еркіндігін шектейді, осылайша қателікті азайтады. Бірақ ол кейбір жағдайларда ұшқыштар өздерінің ең жақсы пайымдауларын қолдануы керек деп сенуі де мүмкін. Бұл жағдайларда стандарттар шу тудырса да, ережелерден әлдеқайда тиімді болуы мүмкін.
Барлық осы жағдайларда және басқа да көптеген жағдайларда ережелер мен стандарттардың арасында таңдау жасайтындар шу мәселесіне, бейімділік мәселесіне немесе екеуіне де назар аударуы керек. Үлкен де, кіші де бизнес мұндай шешімді үнемі қабылдап отырады. Кейде олар мұны интуитивті түрде және нақты негізсіз жасайды.
Стандарттардың формалары мен өлшемдері әртүрлі болады. Олардың іс жүзінде ешқандай мазмұны болмауы мүмкін: «жағдайға байланысты тиісті нәрсені істеңіз». Олар ережелерге жақындайтындай етіп жазылуы мүмкін — мысалы, «тиісті» нәрсе судьяның еркіндігін шектеу үшін нақты анықталған кезде. Ережелер мен стандарттарды араластыруға да болады. Мысалы, кадр бөлімі стандартты қолданар алдында («осы шектеулерді ескере отырып, керемет жұмыс істейтін адамдарды таңдаңыз») ереже қабылдауы мүмкін («барлық үміткерлердің жоғары білімі болуы тиіс»).
Біз ережелер шуды азайтуы немесе тіпті жоюы керек екенін, ал стандарттар (егер шуды азайту стратегиясы қолданылмаса) көбінесе оны көп мөлшерде тудыратынын айттық. Жеке және мемлекеттік ұйымдарда шу көбінесе ережелерді шығармаудың салдары болып табылады. Шу тым қатты болғанда — ұқсас жағдайдағы адамдарға ұқсас мәміле жасалмай жатқанын бәрі көргенде — көбінесе ережелерге қарай қозғалыс басталады. Қылмыстық үкім кесу жағдайындағыдай, бұл қозғалыс үлкен наразылыққа айналуы мүмкін. Әдетте бұл наразылықтың алдында шу аудиті жүргізіледі.
Басылған нәрсенің қайта оралуы
Маңызды сұрақты қарастырыңыз: кім жұмыс істей алмайтын адамдарға арналған экономикалық жәрдемақы алуға құқылы мүгедек болып саналады? Егер сұрақ осылай қойылса, судьялар шулы, демек әділетсіз болатын шұғыл (ad hoc) шешімдер қабылдайды. Америка Құрама Штаттарында мұндай шулы, әділетсіз шешімдер бір кездері қалыпты жағдай болған және нәтижелері масқара болды. Мүгедектер арбасындағы немесе ауыр депрессиясы бар немесе созылмалы ауруы бар екі бірдей адамға екі түрлі қарау орын алды. Бұған жауап ретінде мемлекеттік қызметкерлер ережеге көбірек ұқсайтын нәрсеге — мүгедектік матрицасына (шектеулі параметрлер негізінде шешім шығару кестесі) көшті. Матрица біліміне, географиялық орналасуына және қалған физикалық мүмкіндіктеріне негізделген механикалық пайымдауларды талап етеді. Мақсат — шешімдерді азырақ шулы ету.
Бұл мәселенің басты талқылауында заң профессоры Джерри Машо шулы пайымдауларды жою әрекетіне атау береді: бюрократиялық әділдік (индивидуалды тәсілден гөрі, ережелер мен процедураларға негізделген жүйе). Бұл терминді есте сақтаған жөн. Машо матрицаның құрылуын іргелі әділеттілік ретінде бағалайды, себебі ол шуды жоюға уәде береді. Алайда, кейбір жағдайларда бюрократиялық әділдіктің уәдесі орындалмауы мүмкін. Институт ережеге негізделген шешімдерге көшкен кезде, шудың қайта пайда болу қаупі бар.
Ережелер нақты жағдайларда сұмдық нәтижелер береді делік. Олай болса, судьялар ережелер тым қатал деп есептеп, оларды жай ғана елемеуі мүмкін. Осы себепті олар азаматтық бағынбаудың жеңіл түрі арқылы өз бетінше шешім қабылдауы мүмкін, мұны бақылау немесе тіпті байқау қиын. Жеке компанияларда қызметкерлер ақылға сыйымсыз болып көрінетін қатаң ережелерді елемейді. Сол сияқты, қоғамдық қауіпсіздік пен денсаулықты қорғауға жауапты әкімшілік органдар заңдар тым қатал және ереже тәрізді болса, оларды орындаудан бас тарта алады. Қылмыстық құқықта алқабилердің заңды елемеуі (заң тым қатал болғанда, алқабилердің оны қолданудан бас тартуы) термині алқабилердің заңды мағынасыз, қатал деп тауып, оны орындаудан бас тарту жағдайларын білдіреді.
Мемлекеттік немесе жеке институт қатаң ережелер арқылы шуды бақылауға тырысқанда, ол ережелердің шешім қабылдау еркіндігін «астыртын» жүргізуге мәжбүрлейтін мүмкіндігіне үнемі сақ болуы керек. «Үш қателік» саясаты кезінде прокурорлардың жиі кездесетін реакциясы — бұрын екі рет сотталған адамдарға қарсы ауыр қылмыс туралы айып тақпау — бақылауға және тіпті байқауға өте қиын болды.
Мұндай жағдайлар орын алғанда, шу болады, бірақ оны ешкім естімейді. Ережелеріміздің мақсатына сай жұмыс істеп тұрғанына көз жеткізу үшін оларды қадағалап отыруымыз керек. Егер олай болмаса, шудың болуы белгі болуы мүмкін және ережелерді қайта қарау керек.
Негізгі құрылым
Бизнесте де, үкіметте де ережелер мен стандарттар арасындағы таңдау көбінесе интуитивті түрде жасалады, бірақ бұл процесті тәртіпке келтіруге болады. Алғашқы жуықтау ретінде бұл таңдау тек екі факторға байланысты: (1) шешімдердің құны және (2) қателіктердің құны.
Стандарттар болған жағдайда, шешім қабылдау құны барлық деңгейдегі судьялар үшін өте жоғары болуы мүмкін, өйткені олар стандартты нақты мазмұнмен толтыру үшін еңбектенуі керек. Тұжырым жасау ауыр жүк болуы мүмкін. Егер дәрігерлерге «өз қалауыңша шешім қабылда» десе, олар әр жағдай туралы ойлануға уақыт жұмсауы керек (және бұл тұжырымдарда шу болуы әбден мүмкін). Егер дәрігерлерге пациенттерде стрептококты тамақ ауруы бар-жоғын анықтау үшін нақты нұсқаулықтар берілсе, олардың шешімдері жылдам әрі салыстырмалы түрде қарапайым болады. Егер жылдамдық шегі сағатына алпыс бес миль болса, полиция қызметкерлері адамдарға қаншалықты жылдам жүруге рұқсат етілгені туралы бас қатырмайды, бірақ егер стандарт «негізсіз жылдам» жүруге тыйым салса, офицерлерге көбірек ойлануға тура келеді (және оның орындалуында міндетті түрде шу болады). Ережелер болған кезде шешім қабылдау құны әдетте әлдеқайда төмен болады.
Дегенмен, бұл күрделі мәселе. Ережелер енгізілгеннен кейін оларды қолдану оңай болуы мүмкін, бірақ ереже күшіне енгенге дейін біреу оның қандай болатынын шешуі керек. Ережені әзірлеу қиын болуы мүмкін. Кейде бұл тым қымбатқа түседі. Сондықтан құқықтық жүйелер мен жеке компаниялар көбінесе «негізді» (разумный), «сақтық» (осмотрительный) және «мүмкін болатын» (осуществимый) сияқты сөздерді қолданады. Сондықтан бұл терминдер медицина мен инженерия сияқты салаларда да маңызды рөл атқарады.
Қателіктердің құны қателердің саны мен ауқымын білдіреді. Негізгі сұрақ — агенттердің білімді және сенімді болуында, сондай-ақ олардың шешім гигиенасын (шешім қабылдау кезіндегі қателіктерді азайтуға бағытталған алдын алу шаралары) сақтауында. Егер солай болса, стандарт жақсы жұмыс істеуі мүмкін және шу аз болады. Басшылар өз агенттеріне сенбеуге негіз болған кезде ережелерді енгізуі керек. Егер агенттер біліксіз немесе біржақты болса және олар шешім гигиенасын іс жүзінде қолдана алмаса, онда олар ережелермен шектелуі керек. Парасатты ұйымдар олар беретін өкілеттік деңгейі агенттерге деген сенім деңгейімен тығыз байланысты екенін жақсы түсінеді.
Әрине, толық сенімнен толық сенімсіздікке дейінгі аралық бар. Стандарт сенімсіз агенттер тарапынан көптеген қателіктерге әкелуі мүмкін, бірақ егер бұл қателер болмашы болса, оларға төзуге болады. Ереже санаулы ғана қателікке әкелуі мүмкін, бірақ егер олар апатты болса, біз стандартты таңдауымыз мүмкін. Біз қателіктердің құны ережелерде немесе стандарттарда жоғары болады деп ойлауға ешқандай жалпы негіз жоқ екенін көруіміз керек. Егер ереже мінсіз болса, ол әрине қателік жібермейді. Бірақ ережелер сирек мінсіз болады.
Мысалы, заңда алкогольді тек 21 жасқа толғанда ғана сатып алуға болады делінген делік. Заң жастарды алкоголь тұтынуға байланысты әртүрлі қауіптерден қорғауға бағытталған. Осы тұрғыдан алғанда, заң көптеген қателіктер жібереді. Кейбір 20, 19, 18 немесе тіпті 17 жастағы адамдар алкогольді еш қиындықсыз тұтына алады. Ал кейбір 22, 42 немесе 62 жастағы адамдар олай істей алмайды. Егер біз сәйкес сөз формасын тауып, адамдар бұл сөздерді дәл қолдана алсақ, стандарт аз қателік жіберер еді. Әрине, бұған қол жеткізу өте қиын, сондықтан біз алкогольді сатуда әрқашан жасқа негізделген қарапайым ережелерді көреміз.
Бұл мысал маңыздырақ жайтты аңғартады. Көптеген шешімдер қабылдануы керек болған кезде, шу көп болуы мүмкін және бұл нақты ережелерді енгізудің пайдасына күшті дәлел болады. Егер дерматологтар қышыма бөртпесі мен меңдері бар көптеген пациенттерді қабылдаса, олардың тұжырымдары негізді ережелермен шектелген жағдайда қателер азаюы мүмкін. Мұндай ережелерсіз және ашық стандарттармен шешім қабылдау шығындары тым жоғары болады. Қайталанатын шешімдер үшін ad hoc (арнайы, нақты жағдайға байланысты) тұжырымдардан гөрі механикалық ережелерге көшудің нақты артықшылықтары бар. Шешім қабылдау өкілеттігін қолданудың ауыртпалығы үлкен болып шығады, ал шудың құны немесе ол тудыратын әділетсіздік төзгісіз болуы мүмкін.
Ақылды ұйымдар мінез-құлықты реттеудің екі жолының да кемшіліктерін жақсы біледі. Олар шуды (және біржақтылықты) азайту тәсілі ретінде ережелерді немесе ережелерге жақын стандарттарды қолданады. Қателіктердің құнын барынша азайту үшін олар ережелердің жеткілікті дәрежеде дәл болуын қамтамасыз етуге алдын ала көп уақыт пен көңіл бөлуге дайын.
Шуға тыйым салу керек пе?
Көптеген жағдайларда шу нағыз масқара болуы керек. Адамдар онымен өмір сүреді, бірақ олар бұған мәжбүр болмауы тиіс. Қарапайым жауап — шексіз өкілеттіктен немесе бұлдыр стандарттан ережеге немесе соған жақын нәрсеге көшу. Енді біз бұл қарапайым жауаптың қашан дұрыс болатынын түсіндік. Бірақ ереже енгізу мүмкін болмаған немесе жақсы идея емес деп танылған жағдайда да, біз шуды азайтудың бірқатар стратегияларын анықтадық.
Осының бәрі үлкен сұрақ тудырады: құқықтық жүйе шуға тыйым салуы керек пе? «Иә» деп жауап беру тым оңай болар еді, бірақ заң шуды бақылау үшін қазіргіден әлдеқайда көп нәрсе істеуі керек. Бұл мәселені мынадай тұрғыдан қарастыруға болады. Неміс социологы Макс Вебер «Қадилық әділеттілікке» (жалпы ережелерге бағынбайтын, жеке жағдайға байланысты шығарылатын бейресми төрелік) шағымданды, оны ол жалпы ережелермен тәртіпке келтірілмеген бейресми, ad hoc тұжырымдар деп түсінді. Вебердің пікірінше, қадилық әділеттілік төзгісіз дәрежеде әр жағдайға жеке қарайтын; бұл құқық үстемдігін бұзу еді. Вебер айтқандай, судья «дәлдікпен ресми ережелерге сәйкес және «тұлғаларға қарамастан» төрелік еткен жоқ. Керісінше, ол адамдарды олардың нақты қасиеттеріне және нақты жағдайға байланысты немесе әділеттілік пен нақты нәтиженің орындылығына қарай бағалады».
Бұл тәсіл, Вебердің пайымдауынша, «шешім қабылдаудың ешқандай ұтымды ережелерін білмейді». Вебердің қадилық әділеттілік тудырған төзгісіз шу туралы айтқанын оңай көруге болады. Вебер алдын ала тәртіпке келтірілген бюрократиялық тұжырымдардың өсуін құптады. Ол мамандандырылған, кәсіби және ережеге негізделген тәсілдерді заң эволюциясының соңғы кезеңі ретінде қарастырды. Бірақ Вебер жазғаннан кейін көп уақыт өтсе де, қадилық әділеттіліктің немесе соған ұқсас нәрсенің әлі де кең таралғаны анық. Сұрақ — бұған қатысты не істеу керек.
Біз шуды азайтуды Адам құқықтарының жалпыға бірдей декларациясының бөлігі болуы керек деп айтуға дейін бармас едік, бірақ кейбір жағдайларда шуды құқық бұзушылық деп санауға болады және жалпы алғанда, бүкіл әлемдегі құқықтық жүйелер шуды бақылау үшін әлдеқайда көп күш жұмсауы керек. Қылмыстық жаза кесуді, құқық бұзушылық үшін азаматтық айыппұлдарды, баспана беруді немесе бас тартуды, білім алу мүмкіндіктерін, визаларды, құрылысқа рұқсаттарды және кәсіби лицензияларды қарастырыңыз. Немесе ірі мемлекеттік мекеме жүздеген немесе тіпті мыңдаған адамды жұмысқа қабылдап жатыр және оның шешімдерінде ешқандай қисын мен негіз жоқ делік; бұл жерде шудың какофониясы орын алады. Немесе бала асырап алу агенттігі жас балаларға істі кім қарап жатқанына байланысты мүлдем әртүрлі қарайды делік. Баланың өмірі мен болашағының осындай лотереяға тәуелді болуы қаншалықты қолайлы?
Көптеген жағдайларда мұндай шешімдердегі ауытқулар біржақтылыққа, соның ішінде анықталған когнитивті бұрмалаулар мен кемсітушіліктің белгілі бір түрлеріне байланысты болады. Бұндай жағдайда адамдар бұған төзе алмайды және заң жаңа әрі басқаша тәжірибелерді талап ететін түзетуші құрал ретінде қолданылуы мүмкін. Бүкіл әлемдегі ұйымдар біржақтылықты (bias) басты жау деп санайды. Олардікі дұрыс. Бірақ олар шуды олай көрмейді. Көруі керек.
Көптеген салаларда қазіргі шу деңгейі тым жоғары. Ол үлкен шығындарға әкеліп, сұмдық әділетсіздік тудыруда. Біздің мұнда тізіп шыққанымыз — мұзтаудың шыңы ғана. Заң бұл шығындарды азайту үшін әлдеқайда көп нәрсе істеуі керек. Ол осы әділетсіздікпен күресуі тиіс.
Ережелер мен стандарттар туралы айтсақ: — «Ережелер өмірді жеңілдетеді және шуды азайтады. Бірақ стандарттар адамдарға жағдайдың ерекшеліктеріне бейімделуге мүмкіндік береді». — «Ережелер ме әлде стандарттар ма? Алдымен қайсысы көбірек қателік жіберетінін сұраңыз. Содан кейін қайсысымен жұмыс істеу оңайырақ немесе ауыр екенін сұраңыз». — «Біз көбінесе ережелерді қабылдау керек жерде стандарттарды қолданамыз — жай ғана шуға көңіл бөлмегендіктен». — «Шуды азайту Адам құқықтарының жалпыға бірдей декларациясының бөлігі болмауы керек — тым болмаса әзірге. Дегенмен, шу сұмдық әділетсіз болуы мүмкін. Бүкіл әлемдегі құқықтық жүйелер оны азайту үшін батыл қадамдар жасауды қарастыруы керек».
ШОЛУ ЖӘНЕ ҚОРЫТЫНДЫ
Шуға байыппен қарау
Шу — бұл тұжырымдардың қалаусыз ауытқуы және ол тым көп. Біздің негізгі мақсатымыз — бұл неліктен солай екенін түсіндіру және бұған қатысты не істеуге болатынын көру болды. Біз бұл кітапта көптеген материалдарды қамтыдық және қорытынды ретінде негізгі ойларға қысқаша шолу, сондай-ақ кеңірек көзқарас ұсынамыз.
Тұжырымдар
Біз қолданып жүрген термин бойынша, тұжырым (суждение / адам санасын өлшеу құралы ретінде қолданатын бағалау нысаны) «ойлаумен» шатастырылмауы керек. Бұл әлдеқайда тар ұғым: тұжырым — аспабы адам санасы болып табылатын өлшеудің бір түрі. Басқа өлшемдер сияқты, тұжырым объектіге ұпай (балл) береді. Ұпай міндетті түрде сан болуы шарт емес. «Мэри Джонсонның ісігі, бәлкім, қатерсіз» деген сөз — тұжырым, сол сияқты «Ұлттық экономика өте тұрақсыз», «Фред Уильямс жаңа менеджер ретінде жұмысқа алуға ең қолайлы адам болар еді» және «Бұл тәуекелді сақтандыру сыйақысы 12 000 доллар болуы керек» деген мәлімдемелер де тұжырым болып табылады. Тұжырымдар әртүрлі ақпарат бөліктерін бейресми түрде жалпы бағалауға біріктіреді. Олар есептеулер емес және нақты ережелерге бағынбайды. Мұғалім эссені бағалау үшін тұжырым жасайды, бірақ көп таңдаулы тестті бағалау үшін емес.
Көптеген адамдар кәсіби тұжырымдар жасау арқылы күн көреді және мұндай тұжырымдар әркімге маңызды түрде әсер етеді. Біз мұнда атап өткен кәсіби судьяларға футбол жаттықтырушылары мен кардиологтар, заңгерлер мен инженерлер, Голливуд басшылары мен сақтандыру андеррайтерлері және тағы басқалар жатады. Кәсіби тұжырымдар осы кітаптың назарында болды, өйткені олар жан-жақты зерттелген және олардың сапасы бәрімізге үлкен әсер етеді. Біз үйренген нәрселеріміз адамдардың өмірінің басқа салаларында жасайтын тұжырымдарына да қатысты деп сенеміз.
Кейбір тұжырымдар болжамды болып келеді және кейбір болжамды тұжырымдарды тексеруге болады; уақыт өте келе олардың дәл болған-болмағанын білеміз. Бұл әдетте дәрі-дәрмектің әсері, пандемияның барысы немесе сайлау нәтижелері сияқты нәтижелердің қысқа мерзімді болжамдарына қатысты. Бірақ көптеген тұжырымдар, соның ішінде ұзақ мерзімді болжамдар мен ойдан шығарылған сұрақтарға жауаптар, тексерілмейді. Мұндай тұжырымдардың сапасын тек оларды тудыратын ойлау процесінің сапасымен ғана бағалауға болады. Сонымен қатар, көптеген тұжырымдар болжамды емес, бағалаушы болып келеді: судья тағайындаған жазаны немесе байқаудағы суреттің орнын объективті шындықпен оңай салыстыру мүмкін емес.
Дегенмен, таңқаларлық жайт, тұжырым жасайтын адамдар шындық бар-жоғына қарамастан, ол бар сияқты әрекет етеді. Олар өздері және басқалар мүлт кетпеуі керек көрінбейтін нысана (bull’s-eye) бар сияқты ойлайды және әрекет етеді. «Тұжырым жасау сәті» (judgment call) тіркесі келіспеушілік мүмкіндігін де, оның шектеулі болатыны туралы күтуді де білдіреді. Тұжырым мәселелері шектеулі келіспеушілік күтуімен сипатталады. Олар келіспеушілікке жол берілмейтін есептеу мәселелері мен төтенше жағдайларды қоспағанда, келісім күтілмейтін талғам мәселелерінің арасындағы кеңістікті иеленеді.
Қателіктер: Біржақтылық және Шу
Біржақтылық (bias) тұжырымдар жиынтығындағы қателердің көпшілігі бір бағытта болғанда орын алады. Біржақтылық — бұл орташа қателік, мысалы, атқыштар тобы нысананың үнемі төменгі сол жағына тигізгенде; менеджерлер жылдан жылға сатылымға тым оптимистік қарағанда; немесе компания шығынға батқан жобаларға ақша салуды тоқтатпағанда.
Тұжырымдар жиынтығынан біржақтылықты жою барлық қателерді жоймайды. Біржақтылық жойылған кезде қалатын қателер ортақ емес. Олар — тұжырымдардың қалаусыз ауытқуы, біз шындыққа қолданатын өлшеу құралының сенімсіздігі. Олар — шу. Шу — бірдей болуы керек тұжырымдардағы ауытқу. Біз жедел жәрдем бөлмесіндегі дәрігерлер, қылмыстық жаза кесетін судьялар және сақтандыру компаниясындағы андеррайтерлер сияқты бір-бірін алмастыратын мамандарды жұмысқа алатын ұйымдарда байқалатын шу үшін жүйелік шу (system noise) терминін қолданамыз. Бұл кітаптың көп бөлігі жүйелік шуға арналған.
Біржақтылық пен Шуды Өлшеу
Орташа квадраттық қателік (Mean of Squared Errors, MSE / қателіктердің дәлдігін есептейтін математикалық стандарт) екі жүз жыл бойы ғылыми өлшемдегі дәлдік стандарты болып келеді. MSE-нің негізгі ерекшеліктері — ол іріктелген орташа мәнді популяцияның орташа мәнінің біржақты емес бағасы ретінде береді, оң және теріс қателерді тең қарастырады және үлкен қателерді пропорционалды емес түрде жазалайды. MSE тұжырым қателіктерінің нақты шығындарын көрсетпейді, олар көбінесе асимметриялы болады. Дегенмен, кәсіби шешімдер әрқашан дәл болжамдарды талап етеді. Дауылға тап болған қала үшін қауіпті жете бағаламаудың немесе асыра бағалаудың шығындары бірдей емес екені анық, бірақ сіз бұл шығындардың метеорологтардың дауылдың жылдамдығы мен траекториясы туралы болжамына әсер еткенін қаламайсыз. MSE объективті дәлдік мақсат болып табылатын болжамды тұжырымдарды жасау үшін тиісті стандарт болып табылады.
MSE бойынша өлшенгендей, біржақтылық пен шу — қатенің тәуелсіз және қосылатын көздері. Әрине, біржақтылық әрқашан жаман және оны азайту әрқашан дәлдікті жақсартады. Тұжырымдар анық біржақты болса да, шуды азайтудың әрқашан жақсарту екені интуитивті емес. Тұжырымдар анық біржақты болған күннің өзінде де, ең жақсы шашыраңқылық деңгейі — нөл. Мақсат, әрине, біржақтылықты да, шуды да азайту.
Тексерілетін тұжырымдар жиынтығындағы біржақтылық істің орташа тұжырымы мен сәйкес келетін шын мәні арасындағы айырмашылықпен анықталады. Тексерілмейтін тұжырымдар үшін бұл салыстыру мүмкін емес. Мысалы, андеррайтер белгілі бір тәуекел үшін белгілеген сақтандыру сыйақысының шын мәні ешқашан белгілі болмайды. Сондай-ақ белгілі бір қылмыс үшін әділ жазаның шын мәнін де оңай біле алмаймыз. Бұл білім болмаған кезде, жиі кездесетін және ыңғайлы (бірақ әрқашан дұрыс емес) болжам — тұжырымдар біржақты емес және көптеген судьялардың орташа мәні шын мәннің ең жақсы бағасы болып табылады.
Жүйедегі шуды шу аудиті (жүйедегі ауытқуларды анықтау үшін бірнеше маманның бірдей жағдайды бағалау эксперименті) арқылы бағалауға болады. Біз шын мәнді білмей-ақ шуды өлшей аламыз, нысананың артынан оқтардың шашыраңқылығын көргеніміз сияқты. Шу аудиттері көптеген жүйелердегі, соның ішінде радиология бөлімі мен қылмыстық сот төрелігі жүйесіндегі тұжырымдардың ауытқуын өлшей алады. Олар кейде дағды немесе дайындық деңгейіндегі кемшіліктерге назар аудартуы мүмкін. Және олар жүйелік шуды сандық түрде анықтайды — мысалы, бір топтағы андеррайтерлер тәуекелдерді бағалауда әртүрлі болған кезде.
Біржақтылық пен шудың қайсысы үлкенірек мәселе? Бұл жағдайға байланысты. Жауап шу болып шығуы әбден мүмкін. Қателердің орташа мәні (біржақтылық) қателердің стандартты ауытқуына (шу) тең болған кезде, біржақтылық пен шу жалпы қателікке (MSE) тең үлес қосады. Тұжырымдардың таралуы қалыпты (стандартты қоңырау тәрізді қисық) болған кезде, тұжырымдардың 84%-ы шын мәннен жоғары (немесе төмен) болса, біржақтылық пен шудың әсері тең болады. Бұл кәсіби контексте жиі байқалатын айтарлықтай біржақтылық. Біржақтылық бір стандартты ауытқудан аз болған кезде, шу жалпы қателіктің үлкен көзі болады.
Шу — Бұл Мәселе
Ауытқу кейбір тұжырымдарда проблема тудырмайды, тіпті құпталады. Пікірлердің әртүрлілігі идеялар мен нұсқауларды тудыру үшін өте маңызды. Контрариандық (қарама-қайшы) ойлау инновация үшін маңызды. Киносыншылар арасындағы пікірлердің көптігі — бұл кемшілік емес, артықшылық. Трейдерлер арасындағы келіспеушіліктер нарықты құрайды. Бәсекелес стартаптар арасындағы стратегиялық айырмашылықтар нарыққа ең мықтысын таңдауға мүмкіндік береді. Алайда біз тұжырым мәселелері деп атайтын жағдайларда жүйелік шу әрқашан мәселе болып табылады. Егер екі дәрігер сізге әртүрлі диагноз қойса, олардың кем дегенде біреуі қателеседі.
Бұл кітапты жазуға түрткі болған күтпеген жайттар — жүйелік шудың орасан зор ауқымы және ол келтіретін зиянның көлемі. Бұл екеуі де жалпы күткеннен әлдеқайда асып түседі. Біз бизнес, медицина, қылмыстық сот төрелігі, саусақ ізін талдау, болжау, кадрларды бағалау және саясат сияқты көптеген салалардан мысалдар келтірдік. Сондықтан біздің қорытындымыз: қай жерде тұжырым болса, сол жерде шу бар және ол сіз ойлағаннан да көп.
Қателіктегі шудың үлкен рөлі кездейсоқ қателер маңызды емес, өйткені олар «бірін-бірі жояды» деген кең таралған сенімге қайшы келеді. Бұл сенім қате. Егер нысанаға атылған бірнеше оқ шашырап кетсе, олар орташа есеппен нысананың дәл ортасына тиді деудің пайдасы жоқ. Егер жұмысқа бір үміткер лайықты болғаннан жоғары баға алса, ал екіншісі төмен баға алса, қате адам жұмысқа алынуы мүмкін. Егер бір сақтандыру полисінің бағасы тым жоғары болса, ал екіншісінікі тым төмен болса, екі қате де сақтандыру компаниясы үшін шығынға әкеледі; бірі клиенттен айырылуға, екіншісі ақшадан айырылуға себеп болады.
Қысқасы, егер тұжырымдар ешқандай негізсіз өзгерсе, онда қате бар екеніне сенімді бола аламыз. Шу тіпті тұжырымдарды тексеру мүмкін болмаған және қатені өлшеу мүмкін емес жағдайда да зиянды. Бірдей жағдайдағы адамдарға әртүрлі қарау әділетсіздік, ал кәсіби тұжырымдар тұрақсыз болып көрінетін жүйе сенімділігін жоғалтады.
Шудың Түрлері
Жүйелік шуды деңгейлік шу (level noise) және құрылымдық шу (pattern noise) деп бөлуге болады. Кейбір судьялар әдетте басқаларға қарағанда қатал, ал басқалары жұмсақ; кейбір болжамшылар нарық болашағына әдетте оптимистік (bullish), ал басқалары пессимистік (bearish) қарайды; кейбір дәрігерлер басқаларға қарағанда антибиотиктерді көбірек жазады. Деңгейлік шу — бұл әртүрлі адамдар жасаған орташа тұжырымдардың ауытқуы. Тұжырымдамалық шкалалардың екіұштылығы деңгейлік шудың көздерінің бірі болып табылады. «Мүмкін» сияқты сөздер немесе сандар (мысалы, «0-ден 6-ға дейінгі шкала бойынша 4») әртүрлі адамдар үшін әртүрлі мағынаны білдіреді. Деңгейлік шу — тұжырым жүйелеріндегі қателіктің маңызды көзі және шуды азайтуға бағытталған шаралардың маңызды нысаны.
Жүйелік шу тағы бір, әдетте үлкенірек компонентті қамтиды. Тұжырымдарының орташа деңгейіне қарамастан, екі судья қай қылмыстар қатаң жазаға лайық екендігі туралы пікірлерінде ерекшеленуі мүмкін. Олардың үкімдері істердің әртүрлі рейтингін тудырады. Біз бұл ауытқуды құрылымдық шу (pattern noise; техникалық термині — статистикалық өзара әрекеттесу) деп атаймыз.
Құрылымдық шудың негізгі көзі тұрақты: бұл судьялардың бір іске жеке, идиосинкразиялық (ерекше жеке қабылдау) реакцияларындағы айырмашылық. Бұл айырмашылықтардың кейбірі адамдар саналы түрде немесе бейсаналы түрде ұстанатын принциптерді немесе құндылықтарды көрсетеді. Мысалы, бір судья дүкен ұрыларына өте қатал, ал жол қозғалысы ережесін бұзушыларға ерекше жұмсақ болуы мүмкін; басқасы керісінше әрекет етуі мүмкін. Кейбір негізгі принциптер немесе құндылықтар өте күрделі болуы мүмкін және судья оларды білмеуі де мүмкін. Мысалы, судья өзі байқамай жасы үлкен дүкен ұрыларына салыстырмалы түрде жұмсақ қарауы мүмкін. Сонымен қатар, белгілі бір іске деген өте жеке реакция да тұрақты болуы мүмкін. Судьяның қызына ұқсайтын айыпталушы басқа күні де дәл сондай аяушылық сезімін, демек жұмсақтықты тудыруы әбден мүмкін.
Бұл тұрақты құрылымдық шу судьялардың бірегейлігін көрсетеді: олардың істерге реакциясы олардың тұлғасы сияқты жеке болып келеді. Адамдар арасындағы нәзік айырмашылықтар көбінесе жағымды және қызықты, бірақ кәсіби мамандар жүйелілікті талап ететін жүйеде жұмыс істегенде бұл айырмашылықтар проблемаға айналады.
Біз қарастырған зерттеулерде мұндай жеке айырмашылықтар тудыратын тұрақты құрылымдық шу әдетте жүйелік шудың ең үлкен көзі болып табылады.
Солай болса да, судьялардың белгілі бір істерге қатысты ерекше көзқарастары мүлдем тұрақты емес. Жүйелі шудың кездейсоқ шу (occasion noise — бір сарапшының бір іс бойынша әртүрлі уақытта әртүрлі шешім қабылдауы) деп аталатын өтпелі құрамдас бөлігі де болады.
Егер рентгенолог бір суретке әртүрлі күндері әртүрлі диагноз қойса немесе саусақ ізін тексеруші бір жағдайда екі таңбаны сәйкес деп тауып, екінші жағдайда олай деп таппаса, біз шудың осы түрін анықтаймыз. Осы мысалдар көрсеткендей, кездейсоқ шуды сарапшы істі бұрын көргенін танымаған кезде өлшеу оңайырақ. Кездейсоқ шуды көрсетудің тағы бір жолы — контекстің пайымдауға қатысы жоқ белгілерінің әсерін көрсету, мысалы, судьялар сүйікті футбол командасы жеңіске жеткеннен кейін жұмсақ болады немесе дәрігерлер түстен кейін опиоидтарды көбірек тағайындайды.
Пайымдау психологиясы және шу
Пайымдаудағы қателіктердің жалғыз себебі судьялардың когнитивті кемшіліктері емес. Объективті білместік (objective ignorance — болашақ туралы фактілердің принципі бойынша белгісіздігі) көбінесе үлкенірек рөл атқарады. Кейбір фактілерді білу мүмкін емес — мысалы, кеше туған нәрестенің жетпіс жылдан кейін неше немересі болатыны немесе келесі жылы өтетін лотереяның ұтыс нөмірі. Басқалары білуге болатын шығар, бірақ судьяға белгісіз. Адамдардың өз болжамдарына деген шектен тыс сенімділігі олардың объективті білместігін, сондай-ақ бейімділіктерін төмендетеді.
Біздің болжамдарымыздың дәлдігінің шегі бар және бұл шек көбінесе өте төмен. Соған қарамастан, біз өз пайымдауларымызды жайлы сезінеміз. Бізге осы қанағаттанарлық сенімділікті беретін нәрсе — ішкі сигнал (internal signal — ақпаратты қисынды оқиғаға айналдырғанда мидың беретін марапаты), яғни фактілер мен пайымдауларды біртұтас оқиғаға сәйкестендіргені үшін өзін-өзі марапаттау. Біздің пайымдауларымызға деген субъективті сенімділігіміз олардың объективті дәлдігімен міндетті түрде байланысты емес.
Көптеген адамдар болжамды пайымдауларының дәлдігі төмен ғана емес, сонымен бірге формулалардан да төмен екенін естігенде таң қалады. Тіпті шектеулі деректерге негізделген қарапайым сызықтық модельдер немесе қағаз қиындысына жазып қоюға болатын қарапайым ережелер адам-судьялардан үнемі асып түседі. Ережелер мен модельдердің маңызды артықшылығы — олардың шусыз болуы. Біз пайымдауды нәзік және күрделі процесс ретінде субъективті түрде сезінеміз; бізде бұл нәзіктіктің негізінен шу болуы мүмкін екендігі туралы ешқандай белгі жоқ. Қарапайым ережелерге ойланбастан бағыну бізге қарағанда жоғары дәлдікке жиі қол жеткізетінін елестету біз үшін қиын — бірақ бұл қазірдің өзінде жақсы дәлелденген факт.
Психологиялық бейімділіктер (psychological biases — жүйелі қателіктерге әкелетін ойлау үлгілері), әрине, жүйелі қателіктің немесе статистикалық ауытқудың көзі болып табылады. Олардың шудың да көзі екені онша айқын емес. Бейімділіктерді барлық судьялар бірдей бөліспегенде, олар әртүрлі дәрежеде болғанда және олардың әсері бөгде жағдайларға байланысты болғанда, психологиялық бейімділіктер шу тудырады.
Мысалы, егер жұмысқа қабылдау туралы шешім қабылдайтын менеджерлердің жартысы әйелдерге қарсы болса, ал қалған жартысы олардың пайдасына болса, жалпы бейімділік болмайды, бірақ жүйелік шу жұмысқа қабылдауда көптеген қателіктерге әкеледі. Тағы бір мысал — алғашқы әсердің пропорционалды емес әсері. Бұл психологиялық бейімділік, бірақ дәлелдемелердің ұсынылу реті кездейсоқ өзгерген кезде бұл бейімділік кездейсоқ шуды тудырады.
Біз пайымдау процесін шкала бойынша пайымдау жасау үшін бірқатар белгілерді бейресми интеграциялау ретінде сипаттадық. Сондықтан жүйелік шуды жою судьялардан белгілерді қолдануда, оларға беретін салмақтарында және шкаланы қолдануда біркелкілікті сақтауды талап етеді. Кездейсоқ шудың кездейсоқ әсерлерін ескермегеннің өзінде, бұл шарттар сирек орындалады.
Бір өлшемді пайымдауларда келісім деңгейі көбінесе өте жоғары. Әртүрлі рекрутерлер екі кандидаттың қайсысы харизматикалық немесе ұқыпты екенін бағалауда жиі келіседі. Қарқындылық өлшемдері бойынша сәйкестендірудің (matching — бір өлшемдегі мәнді екінші өлшемге ауыстыру) ортақ интуитивті процесі — мысалы, адамдар жоғары GPA-ды ерте оқу жасына сәйкестендіргенде — әдетте ұқсас пайымдауларды тудырады. Сол сияқты бір бағытты көрсететін аз ғана белгілерге негізделген пайымдауларға да қатысты.
Пайымдау бірнеше қарама-қайшы белгілерге салмақ беруді талап еткенде, үлкен жеке айырмашылықтар пайда болады. Бір кандидатқа қарап, кейбір рекрутерлер оның дарындылығы мен харизмасына көбірек мән береді; басқаларына ұқыптылық немесе қысым кезіндегі сабырлылық көбірек әсер етеді. Белгілер сәйкес келмесе және біртұтас оқиғаға сыймаса, әртүрлі адамдар сөзсіз белгілі бір белгілерге көбірек мән беріп, басқаларын елемейді. Нәтижесінде жүйелі шу пайда болады.
Шудың көмескілігі
Шу — басты мәселе емес. Ол сирек талқыланады және ол бейімділікке қарағанда аз байқалады. Сіз бұл туралы көп ойламаған боларсыз. Оның маңыздылығын ескерсек, шудың көмескілігі — бұл өз алдына қызықты құбылыс.
Когнитивті бейімділіктер және ойлаудың басқа да эмоционалды немесе мотивациялық бұрмаланулары көбінесе нашар пайымдаулардың түсіндірмесі ретінде қолданылады. Сарапшылар сәтсіз аяқталған шешімдерді түсіндіру үшін шектен тыс сенімділікке, якорь эффектісіне, шығыннан қашуға, қолжетімділік бейімділігіне және басқа да бейімділіктерге жүгінеді. Мұндай бейімділікке негізделген түсіндірмелер қанағаттанарлық болып табылады, өйткені адам санасы себеп-салдарлық түсіндірулерді қалайды. Бірдеңе дұрыс болмай қалса, біз себебін іздейміз — және оны жиі табамыз. Көптеген жағдайларда себеп бейімділік болып көрінеді.
Бейімділіктің өзіндік түсіндірмелі харизмасы бар, ол шуға тән емес. Егер біз өткенге қарап, белгілі бір шешімнің неге қате болғанын түсіндіруге тырыссақ, біз бейімділікті оңай табамыз, бірақ ешқашан шуды таппаймыз. Тек әлемге деген статистикалық көзқарас (statistical view — оқиғаларды жеке емес, үлкен деректер жиынтығының бөлігі ретінде көру) бізге шуды көруге мүмкіндік береді, бірақ бұл көзқарас табиғи түрде келмейді — біз себеп-салдарлық оқиғаларды қалаймыз. Статистикалық ойлаудың интуициямызда жоқтығы — шудың бейімділікке қарағанда әлдеқайда аз көңіл бөлінуінің бір себебі.
Тағы бір себебі — мамандар өздерінің және әріптестерінің пайымдауларындағы шумен бетпе-бет келу қажеттілігін сирек сезінеді. Оқу кезеңінен кейін мамандар жиі өз бетінше пайымдау жасайды. Саусақ ізі сарапшылары, тәжірибелі андеррайтерлер және ардагер патент қызметкерлері әріптестерінің олармен қалай келіспеуі мүмкін екенін елестетуге сирек уақыт бөледі — және олар өздерімен-өздері қалай келіспеуі мүмкін екенін елестетуге одан да аз уақыт жұмсайды.
Көп жағдайда мамандар өз пайымдауларына сенімді болады. Олар әріптестері олармен келіседі деп күтеді және олардың шынымен келісетінін ешқашан білмейді. Көптеген салаларда пайымдау ешқашан шынайы құндылыққа қарсы бағаланбауы мүмкін және ең көп дегенде құрметті сарапшы деп саналатын басқа маманның тексеруінен өтеді. Тек кейде ғана мамандар таңқаларлық келіспеушілікке тап болады, ал бұл жағдайда олар әдетте оны оқшауланған жағдай ретінде қарастыруға себеп табады. Ұйымдардың күнделікті жұмыс тәртібі де олардың арасындағы сарапшылардың пікір алшақтығын елемеуге немесе жасыруға бейім. Бұл түсінікті; ұйымдық тұрғыдан алғанда, шу — бұл ыңғайсыздық.
Шуды қалай азайтуға болады (және бейімділікті де)
Кейбір адамдар басқаларға қарағанда жақсырақ пайымдау жасайды деп сенуге негіз бар. Нақты тапсырмаға тән дағдылар, интеллект және белсенді ашық ойлылық (actively open-minded — өз пікіріне қайшы келетін ақпаратты іздеуге дайындық) деп сипатталатын белгілі бір когнитивті стиль ең жақсы судьяларға тән. Жақсы судьялардың өрескел қателіктерді аз жіберетіні таңқаларлық емес. Дегенмен, жеке айырмашылықтардың көптеген көздерін ескере отырып, біз тіпті ең жақсы судьялардың күрделі пайымдау мәселелерінде толық келісімде болуын күтпеуіміз керек. Әрқайсымызды бірегей ететін тегіміздің, жеке басымыздың және тәжірибеміздің шексіз алуан түрлілігі — шуды болдырмайтын нәрсе.
Қателерді азайтудың бір стратегиясы — бейімділіктен арылу. Әдетте адамдар пайымдауларды фактіден кейін түзету немесе бейімділіктер пайымдауға әсер етпес бұрын оларды ауыздықтау арқылы өз пайымдауларынан бейімділікті алып тастауға тырысады. Біз үшінші нұсқаны ұсынамыз, ол әсіресе топтық ортада қабылданған шешімдерге қатысты: бейімділік белгілерін анықтау үшін шешім бақылаушысын (decision observer — талқылау кезінде когнитивті қателіктерді бақылап отыратын адам) тағайындау арқылы бейімділіктерді нақты уақыт режимінде анықтау.
Пайымдаудағы шуды азайту бойынша біздің басты ұсынысымыз — шешім гигиенасы (decision hygiene — қателіктердің алдын алуға бағытталған әдістер жиынтығы). Біз бұл терминді таңдадық, өйткені шуды азайту, денсаулық гигиенасы сияқты, анықталмаған жаудан қорғану болып табылады. Мысалы, қол жуу белгісіз патогендердің ағзамызға енуіне жол бермейді. Сол сияқты, шешім гигиенасы қателіктердің не екенін білмей-ақ олардың алдын алады. Шешім гигиенасы оның атауы сияқты тартымсыз және болжамды бейімділіктерге қарсы жеңісті күрестен гөрі қызықсыз. Анықталмаған зиянның алдын алуда ешқандай даңқ болмауы мүмкін, бірақ бұл өте маңызды іс.
Ұйымдағы шуды азайту әрекеті әрқашан шу аудитінен (noise audit — ұйымдағы шешімдердің алшақтығын статистикалық зерттеу) басталуы керек. Аудиттің маңызды функциясы — ұйымның шуды байыппен қабылдауға міндеттеме алуын қамтамасыз ету. Маңызды артықшылық — шудың жеке түрлерін бағалау.
Шешім гигиенасының алты принципі
Пайымдаудың мақсаты — өзіндік ерекшелікті көрсету емес, дәлдік. Бұл мәлімдеме — пайымдаудағы шешім гигиенасының бірінші принципіне біздің кандидатымыз. Ол біздің осы кітапта пайымдауды анықтаған тар, нақты жолымызды көрсетеді. Біз тұрақты жүйелі шудың жүйелік шудың үлкен құрамдас бөлігі екенін және ол әртүрлі адамдарды бір мәселе бойынша әртүрлі көзқарастарды қалыптастыруға итермелейтін жеке айырмашылықтардың, пайымдау тұлғаларының тікелей салдары екенін көрсеттік. Бұл бақылау қашу мүмкін емес, бірақ танымал емес қорытындыға әкеледі: пайымдау — сіздің даралығыңызды білдіретін орын емес.
Жеке құндылықтар, даралық және шығармашылық ойлау мен шешім қабылдаудың көптеген кезеңдерінде, соның ішінде мақсаттарды таңдау, мәселеге келудің жаңа жолдарын тұжырымдау және нұсқаларды жасау үшін қажет, тіпті маңызды. Бірақ осы нұсқалар туралы пайымдау жасауға келгенде, даралықтың көріністері шудың көзі болып табылады. Мақсат — дәлдік болса және сіз басқалардың сізбен келісетінін күтсеңіз, сіз сондай-ақ сіздің орныңызда басқа құзыретті судьялар не ойлайтынын ескеруіңіз керек.
Осы принциптің радикалды қолданылуы — пайымдауды ережелермен немесе алгоритмдермен алмастыру. Алгоритмдік бағалау шуды жоюға кепілдік береді — шынында да, бұл шуды толығымен жоя алатын жалғыз тәсіл. Алгоритмдер көптеген маңызды салаларда қолданылып жатыр және олардың рөлі артып келеді. Бірақ алгоритмдер маңызды шешімдердің соңғы кезеңінде адам пайымдауын алмастыруы екіталай — және біз мұны жақсы жаңалық деп санаймыз. Дегенмен, пайымдауды алгоритмдерді тиісінше қолдану арқылы да, шешімдерді бір маманның ерекшеліктеріне азырақ тәуелді ететін тәсілдерді қабылдау арқылы да жақсартуға болады. Мысалы, шешім қабылдау нұсқаулары судьялардың еркін шектеуге немесе дәрігерлердің диагноздарындағы біртектілікті ілгерілетуге және осылайша шуды азайтып, шешімдерді жақсартуға қалай көмектесетінін көрдік.
- Статистикалық түрде ойлаңыз және іске сырттан қараңыз. Біз сарапшы істі бірегей мәселе ретінде емес, ұқсас істердің анықтамалық класының мүшесі ретінде қарастырғанда, оған сырттан қарайды деп айтамыз. Бұл тәсіл қарастырылып отырған іске нық назар аударатын және оны себеп-салдарлық оқиғаға енгізетін әдепкі ойлау режимінен ерекшеленеді. Адамдар іс туралы бірегей көзқарас қалыптастыру үшін өздерінің бірегей тәжірибесін қолданғанда, нәтижесі жүйелі шу болады. Сыртқы көзқарас — бұл мәселенің емі: бірдей анықтамалық класты бөлісетін мамандар азырақ шулы болады. Сонымен қатар, сыртқы көзқарас жиі құнды түсініктер береді.
Сыртқы көзқарас принципі ұқсас істердің статистикасында болжамдарды негіздеуді қолдайды. Ол сондай-ақ болжамдардың бірқалыпты болуы керек деген ұсынысқа әкеледі (техникалық термин — регрессивті, regressive — болжамдардың орташа мәнге жақындауы). Өткен нәтижелердің кең ауқымына және олардың шектеулі болжамдылығына назар аудару шешім қабылдаушыларға өз пайымдауларына деген сенімділігін калибрлеуге көмектесуі керек. Адамдарды болжау мүмкін емес нәрсені болжай алмағаны үшін айыптауға болмайды, бірақ оларды болжамды кішіпейілділіктің жоқтығы үшін кінәлауға болады.
- Пайымдауларды бірнеше тәуелсіз тапсырмаларға бөліңіз. Бұл «бөлшекте де билей бер» принципі біз артық үйлесімділік (excessive coherence — ақпаратты біртұтас оқиғаға күштеп сәйкестендіруге тырысу) деп сипаттаған психологиялық механизмге байланысты қажет, ол адамдарды бұрыннан бар немесе жаңадан пайда болған оқиғаға сәйкес келмейтін ақпаратты бұрмалауға немесе елемеуге мәжбүр етеді. Істің әртүрлі аспектілері туралы әсерлер бір-бірін ластаған кезде жалпы дәлдік зардап шегеді. Аналогия үшін, бір топ куәгерге бір-бірімен сөйлесуге рұқсат берілгенде, олардың айғақтарының құндылығымен не болатынын ойлап көріңіз.
Адамдар пайымдау мәселесін бірқатар кішігірім тапсырмаларға бөлу арқылы артық үйлесімділікті азайта алады. Бұл әдіс құрылымдалған сұхбат практикасына ұқсас, мұнда сұхбат алушылар бір уақытта бір қасиетті бағалайды және келесісіне көшпес бұрын оған ұпай береді. Құрылымдау принципі Апгар шкаласы сияқты диагностикалық нұсқауларды шабыттандырады. Ол сондай-ақ біз аралық бағалау хаттамасы (mediating assessments protocol — күрделі шешімді тәуелсіз бағаланатын бөліктерге бөлу әдісі) деп атаған тәсілдің негізінде жатыр. Бұл хаттама күрделі пайымдауды бірнеше фактіге негізделген бағалауларға бөледі және олардың әрқайсысының басқалардан тәуелсіз бағалануын қамтамасыз етуді мақсат етеді. Мүмкін болған жағдайда, бағалауды әртүрлі топтарға тапсыру және олардың арасындағы байланысты азайту арқылы тәуелсіздік қорғалады.
- Мезгілсіз интуицияға қарсы тұрыңыз. Біз шешім қабылдаушыларға өз пайымдауларына сенімділік беретін пайымдаудың аяқталғаны туралы ішкі сигналды сипаттадық. Шешім қабылдаушылардың осы марапаттаушы сигналдан бас тартқысы келмеуі — нұсқаулықтарды, алгоритмдерді және олардың қолдарын байлайтын басқа ережелерді қолдануға қарсылықтың негізгі себебі. Шешім қабылдаушылар өздерінің соңғы таңдауларына жайлы болуы және интуитивті сенімділіктің марапаттау сезіміне қол жеткізуі керек екені анық. Бірақ олар бұл марапатты өздеріне мерзімінен бұрын бермеуі керек. Дәлелдемелерді теңдестірілген және мұқият қарастыру арқылы негізделген интуитивті таңдау асығыс пайымдаудан әлдеқайда жоғары. Интуицияға тыйым салудың қажеті жоқ, бірақ ол хабардар, тәртіпті және кешіктірілген болуы керек.
Бұл принцип біздің ақпаратты реттеу (sequence the information — ақпаратты белгілі бір кезекпен ұсыну) ұсынысымызды тудырады: пайымдау жасайтын мамандарға оларға қажет емес және тіпті ол ақпарат дәл болса да, оларды бейімдей алатын ақпарат берілмеуі керек. Мысалы, сот сараптамасында сарапшыларды күдікті туралы басқа ақпараттан хабардар етпеу — жақсы тәжірибе. Талқылау күн тәртібін бақылау — аралық бағалау хаттамасының негізгі элементі — бұл жерге де жатады. Тиімді күн тәртібі мәселенің әртүрлі аспектілерінің бөлек қарастырылуын және бағалау профилі аяқталғанша тұтас пайымдаудың қалыптасуының кешіктірілуін қамтамасыз етеді.
- Бірнеше судьядан тәуелсіз пайымдаулар алыңыз, содан кейін сол пайымдауларды біріктіруді қарастырыңыз. Тәуелсіздік талабы ұйымдардың процедураларында, әсіресе қатысушылардың пікірлері басқалардың пікірлерімен қалыптасатын жиналыстарда үнемі бұзылады. Каскадтық әсерлер мен топтық поляризацияға байланысты топтық талқылаулар жиі шуды арттырады. Талқылауға дейін қатысушылардың пайымдауларын жинаудың қарапайым процедурасы шудың дәрежесін ашады және келіспеушіліктерді сындарлы түрде шешуге ықпал етеді.
Тәуелсіз пайымдауларды орташаландыру жүйелік шуды азайтуға кепілдік береді (бірақ бейімділікті емес). Бір пайымдау — бұл барлық мүмкін пайымдаулар популяциясынан алынған бір үлгі; ал үлгі мөлшерін арттыру бағалаулардың дәлдігін жақсартады. Судьялардың әртүрлі дағдылары мен толықтырушы пайымдау үлгілері болған кезде орташаландырудың артықшылығы одан әрі артады. Шулы топтың орташа мәні бірауыздан қабылданған шешімнен дәлірек болуы мүмкін.
- Салыстырмалы пайымдаулар мен салыстырмалы шкалаларға артықшылық беріңіз. Салыстырмалы пайымдаулар абсолютті пайымдауларға қарағанда азырақ шулы, өйткені біздің нысандарды шкала бойынша санаттарға бөлу қабілетіміз шектеулі, ал жұптық салыстыру жасау қабілетіміз әлдеқайда жақсы. Салыстыруды қажет ететін пайымдау шкалалары абсолютті пайымдауларды талап ететін шкалаларға қарағанда азырақ шулы болады. Мысалы, кейс шкаласы (case scale — шешімді барлығына таныс нақты мысалдармен салыстыру) судьялардан істі барлығына таныс жағдайлармен анықталатын шкала бойынша орналастыруды талап етеді.

Біз жаңа ғана тізіп өткен шешім гигиенасы принциптері тек қайталанатын пайымдауларға ғана емес, сонымен қатар біржолғы ірі шешімдерге немесе біз бірегей шешімдер (singular decisions — қайталанбайтын, стратегиялық маңызы бар таңдаулар) деп атайтын шешімдерге де қатысты. Бірегей шешімдерде шудың болуы интуицияға қайшы болып көрінуі мүмкін: анықтама бойынша, егер сіз тек бір рет шешім қабылдасаңыз, өлшейтін ауытқушылық жоқ. Соған қарамастан, шу сол жерде және қателіктерге әкеледі. Мергендер тобындағы шу, егер біз тек бірінші мергеннің әрекетін көрсек, көрінбейді, бірақ басқа мергендерді көрсек, шашырау айқын болар еді. Сол сияқты, бірегей пайымдаулар туралы ойлаудың ең жақсы жолы — оларды тек бір рет жасалатын қайталанатын пайымдаулар ретінде қарастыру. Сондықтан шешім гигиенасы оларды да жақсартуы керек.
Шешім гигиенасын енгізу алғыссыз іс болуы мүмкін. Шу — көрінбейтін жау, ал көрінбейтін жауға қарсы жеңіс тек көрінбейтін жеңіс болуы мүмкін. Бірақ физикалық денсаулық гигиенасы сияқты, шешім гигиенасы да өте маңызды. Сәтті отадан кейін сіз өміріңізді сақтап қалған хирургтың шеберлігі деп сенгіңіз келеді — және бұл, әрине, солай болды — бірақ егер хирург пен ота бөлмесіндегі барлық қызметкерлер қолдарын жумағанда, сіз өліп қалуыңыз мүмкін еді. Гигиенада көп даңқ болмауы мүмкін, бірақ нәтижелер бар.
Қаншалықты шу бар?
Әрине, шумен күрес — шешім қабылдаушылар мен ұйымдар үшін жалғыз мәселе емес. Шуды азайту тым қымбатқа түсуі мүмкін: орта мектеп әрбір эссені бес мұғалімге оқыту арқылы бағалаудағы шуды жоя алар еді, бірақ бұл ауыртпалықты ақтау қиын. Кейбір шу іс жүзінде сөзсіз болуы мүмкін, бұл әр істі жеке қарастыратын, адамдарға машинадағы тетік ретінде қарамайтын және шешім қабылдаушыларға еркіндік сезімін беретін тиісті құқықтық процесс жүйесінің қажетті жанама әсері. Кейбір шу, егер ол тудыратын өзгеріс жүйенің уақыт өте келе бейімделуіне мүмкіндік берсе, тіпті қажет болуы да мүмкін — мысалы, шу өзгеретін құндылықтар мен мақсаттарды көрсетіп, практикада немесе заңда өзгерістерге әкелетін пікірталас тудырғанда.
Бәлкім, ең бастысы, шуды азайту стратегияларының жағымсыз жақтары болуы мүмкін. Алгоритмдер туралы көптеген қауіптер асыра сілтеген, бірақ кейбіреулері орынды. Алгоритмдер адам ешқашан жібермейтін ақымақ қателіктер жіберуі мүмкін, сондықтан олар адамдар жіберетін көптеген қателіктердің алдын алуда сәтті болса да, сенімін жоғалтуы мүмкін. Олар нашар дизайн немесе жеткіліксіз деректерде оқыту арқылы бейімді болуы мүмкін. Олардың «бет-бейнесінің» жоқтығы сенімсіздік тудыруы мүмкін. Шешім гигиенасы тәжірибесінің де жағымсыз жақтары бар: егер дұрыс басқарылмаса, олар шешімдерді бюрократияландыру және автономиясы шектеліп жатқанын сезетін мамандардың рухын түсіру қаупін тудырады.
Барлық осы тәуекелдер мен шектеулер мұқият қарастыруға лайық. Дегенмен, шуды азайтуға қарсылықтың мағынасы бар-жоғы талқыланып жатқан нақты шуды азайту стратегиясына байланысты. Пайымдауларды біріктіруге қарсылық — бәлкім, бұл тым қымбат деген негізде — нұсқаулықтарды қолдануға қатысты болмауы мүмкін. Әрине, шуды азайту шығындары оның пайдасынан асып кеткен кезде, оны жүзеге асырмау керек. Шығын мен пайда есептелгеннен кейін, ол нөлге тең емес шудың оңтайлы деңгейін көрсетуі мүмкін. Мәселе мынада, шу аудиті болмаған жағдайда адамдар өз пайымдауларында қаншалықты шу бар екенін білмейді. Солай болған жағдайда, шуды азайтудың қиындығына сілтеме жасау — оны өлшемеу үшін сылтау ғана.
Бейімділік қателіктерге және әділетсіздікке әкеледі. Шу да солай етеді — соған қарамастан, біз бұл туралы әлдеқайда аз әрекет етеміз. Пайымдаудағы қателік біз оны белгілі бір себеппен байланыстырғаннан гөрі, кездейсоқ болған кезде төзімдірек болып көрінуі мүмкін; бірақ ол кем түспейтін зиян келтіреді. Егер біз маңызды нәрселер туралы жақсырақ шешім қабылдағымыз келсе, шуды азайтуға байыппен қарауымыз керек.
ЭПИЛОГ
Шуы азырақ әлем
Егер ұйымдар шуды азайту үшін қайта жобаланса, олардың қандай болатынын елестетіп көріңізші. Ауруханалар, жалдау комиссиялары, экономикалық болжаушылар, мемлекеттік органдар, сақтандыру компаниялары, қоғамдық денсаулық сақтау органдары, қылмыстық сот жүйелері, заң фирмалары мен университеттер шу мәселесіне өте сақ болып, оны азайтуға ұмтылар еді. Шу аудиті (ұйымдағы кәсіби шешімдердің бірізділігін тексеру процесі) күнделікті жұмысқа айналар еді; олар жыл сайын өткізілуі мүмкін.
Ұйым басшылары адамның пайымдауын алмастыру немесе оны толықтыру үшін алгоритмдерді қазіргіге қарағанда әлдеқайда көп салаларда қолданар еді. Адамдар күрделі пайымдауларды қарапайым делдалдық бағалауларға бөлер еді. Олар шешім гигиенасы (қателерді азайтуға бағытталған алдын алу шаралары) туралы біліп, оның нұсқауларын орындар еді. Тәуелсіз пікірлер жинақталып, біріктірілер еді. Жиналыстар мүлдем басқаша көрінер еді; талқылаулар құрылымдырақ болар еді. Сыртқы көзқарас (ұқсас жағдайлардың статистикасына негізделген бағалау) шешім қабылдау процесіне жүйелі түрде біріктірілер еді. Ашық келіспеушіліктер жиілеп, сонымен бірге конструктивті түрде шешілер еді.
Нәтижесінде шуы азырақ әлем қалыптасар еді. Бұл орасан зор қаражатты үнемдеп, қоғамдық қауіпсіздік пен денсаулықты жақсартар еді, әділдікті арттырып, көптеген болдырмауға болатын қателіктердің алдын алар еді. Бұл кітапты жазудағы біздің мақсатымыз — осы мүмкіндікке назар аударту болды. Сіз де осы мүмкіндікті пайдаланатындардың қатарында боласыз деп үміттенеміз.
А ҚОСЫМШАСЫ
Шу аудитін қалай жүргізу керек
Бұл қосымша шу аудитін жүргізуге арналған практикалық нұсқаулық болып табылады. Сіз мұны өз бөлімшелерінің бірінде шу аудитін жүргізу арқылы қызметкерлер шығаратын кәсіби пайымдаулардың сапасын тексеру үшін ұйым жалдаған консультанттың көзқарасымен оқуыңыз керек.
Атауынан көрініп тұрғандай, аудиттің басты назары — шудың таралу деңгейі. Дегенмен, жақсы жүргізілген аудит біржақтылықтар (biases), «соқыр нүктелер» және қызметкерлерді оқыту мен олардың жұмысын қадағалаудағы нақты кемшіліктер туралы құнды ақпарат береді. Сәтті өткен аудит бөлімшенің жұмысына, соның ішінде мамандардың пайымдауларына бағыт беретін доктринаға, олар алатын дайындыққа, пайымдауларын қолдау үшін пайдаланатын құралдарға және олардың жұмысын күнделікті қадағалауға өзгерістер енгізуге түрткі болуы тиіс. Егер бұл талпыныс сәтті деп танылса, оны ұйымның басқа бөлімшелеріне де таратуға болады.
Шу аудиті айтарлықтай көлемдегі жұмысты және егжей-тегжейге үлкен назар аударуды талап етеді, өйткені оның нәтижелері маңызды кемшіліктерді анықтаса, оның сенімділігіне күмән келтірілуі мүмкін. Сондықтан істердің әрбір детальі мен процедурасы ықтимал қатал сынды ескере отырып қарастырылуы керек. Біз сипаттайтын процесс аудиттің ең маңызды сыншылары болуы мүмкін мамандарды оның авторлары ретінде тарту арқылы қарсылықты азайтуды көздейді.
Консультантпен бірге (ол сыртқы немесе ішкі маман болуы мүмкін), жобаға қатысушы негізгі тұлғалар мыналар:
Жобалық топ. Жобалық топ зерттеудің барлық кезеңдеріне жауапты болады. Егер консультанттар ішкі мамандар болса, олар жобалық топтың негізін құрайды. Егер консультанттар сыртқы мамандар болса, ішкі жобалық топ олармен тығыз жұмыс істейді. Бұл компания қызметкерлерінің аудитті өздерінің жобасы ретінде қабылдауын және консультанттарды тек қолдаушы рөлде көруін қамтамасыз етеді. Мәліметтерді жинауды басқаратын, нәтижелерді талдайтын және қорытынды есеп дайындайтын консультанттардан бөлек, жобалық топқа сарапшылар бағалайтын істерді құрастыра алатын салалық мамандар кіруі керек. Жобалық топтың барлық мүшелері жоғары кәсіби беделге ие болуы тиіс. Клиенттер. Шу аудиті маңызды өзгерістерге әкелген жағдайда ғана пайдалы болады, бұл үшін жобаның «клиенті» болып табылатын ұйым басшылығын ерте бастан тарту қажет. Клиенттердің басында шудың таралу деңгейіне күмәнмен қарауын күтуге болады. Егер бұл бастапқы күмән ашық көзқараспен, аудит нәтижелеріне деген қызығушылықпен және консультанттың пессимистік болжамдары расталған жағдайда жағдайды түзетуге деген дайындықпен ұласса, бұл іс жүзінде артықшылық болып табылады. Судьялар (Бағалаушылар). Клиенттер аудиттен өтетін бір немесе бірнеше бөлімшені тағайындайды. Таңдалған бөлімше компания атынан ұқсас пайымдаулар мен шешімдер қабылдайтын «судьялардан», яғни мамандардың айтарлықтай санынан тұруы керек. Судьялар іс жүзінде бірін-бірі алмастыра алатын болуы тиіс; яғни, егер бір адам істі қарауға бос болмаса, басқасы тағайындалып, ол да ұқсас пайымдауға келеді деп күтілуі керек. Бұл кітаптың басында келтірілген мысалдар федералды судьялардың үкім кесу туралы шешімдері және сақтандыру компаниясындағы тәуекел сыйлықақылары мен шығын резервтерін белгілеу болды. Шу аудиті үшін (1) жазбаша ақпарат негізінде орындалатын және (2) сандық түрде (мысалы, доллармен, ықтималдықпен немесе рейтингпен) көрсетілетін пайымдау тапсырмасын таңдаған дұрыс. Жоба менеджері. Әкімшілік штаттағы жоғары деңгейлі менеджер жоба менеджері болып тағайындалуы тиіс. Бұл тапсырма үшін арнайы кәсіби білім талап етілмейді. Дегенмен, ұйымдағы жоғары лауазым әкімшілік кедергілерді жеңуде практикалық маңызға ие және компанияның жобаға қаншалықты мән беретінін көрсетеді. Жоба менеджерінің міндеті — жобаның барлық кезеңдерін, соның ішінде қорытынды есепті дайындауды және оның тұжырымдарын компания басшылығына жеткізуді жеңілдету үшін әкімшілік қолдау көрсету.
Іс материалдарын құрастыру
Жобалық топтың құрамына кіретін салалық мамандар бөлімшенің міндеттері бойынша (мысалы, тәуекелдер үшін сыйлықақыларды белгілеу немесе ықтимал инвестициялардың әлеуетін бағалау) мойындалған сарапшылар болуы керек. Олар аудитте пайдаланылатын істерді әзірлеуге жауапты болады. Мамандардың жұмыс орнында жасайтын пайымдауларының сенімді симуляциясын жасау — нәзік мәселе, әсіресе зерттеу елеулі мәселелерді анықтаған жағдайда оның қатаң тексерістен өтетінін ескерсек. Топ мына сұрақты ойлануы керек: егер біздің симуляция нәтижелері шудың жоғары деңгейін көрсетсе, компаниядағы адамдар бөлімшенің нақты пайымдауларында шу бар екенін мойындай ма? Егер жауап нақты «иә» болса ғана, шу аудитін жүргізудің мәні бар.
Оң жауап алудың бірнеше жолы бар. 1-тарауда сипатталған үкім кесуге қатысты шу аудиті әрбір істі маңызды сипаттардың қысқаша схемалық тізімімен жинақтап, тоқсан минут ішінде он алты іске баға берді. 2-тарауда сипатталған сақтандыру компаниясындағы шу аудиті күрделі істердің егжей-тегжейлі және шынайы қысқаша мазмұнын пайдаланды. Екі жағдайда да жоғары шу деңгейінің анықталуы қолайлы дәлел болды, өйткені егер жеңілдетілген істерде көптеген келіспеушіліктер табылса, нақты істерде шу одан да нашар болады деген уәж айтылды.
Әрбір судьяның сол іс бойынша пайымдауға келуіне түрткі болған ой-түйіндерін тереңірек түсіну үшін әр іске арналған сауалнама дайындалуы керек. Сауалнама барлық істер аяқталғаннан кейін ғана жүргізілуі тиіс. Ол мыналарды қамтуы керек:
Қатысушының жауабына әсер еткен негізгі факторлар туралы ашық сұрақтар. Іс фактілерінің тізімі, бұл қатысушыға олардың маңыздылығын бағалауға мүмкіндік береді. Іс жататын санатқа «сыртқы көзқараспен» қарауды талап ететін сұрақтар. Мысалы, егер істер долларлық бағалауды талап етсе, қатысушылар бұл істің сол санаттағы барлық жағдайлардың орташа мәнінен қаншалықты төмен немесе жоғары екенін бағалауы керек.
Басшылармен іске қосу алдындағы кездесу
Аудитте пайдаланылатын іс материалдары жиналғаннан кейін, жобалық топ компания басшылығына аудитті таныстыратын кездесу жоспарлануы тиіс. Бұл кездесуде зерттеудің ықтимал нәтижелері, соның ішінде жүйелік шудың шектен тыс деңгейі анықталған жағдай талқылануы керек. Кездесудің мақсаты — жоспарланған зерттеуге қатысты қарсылықтарды тыңдау және басшылықтан оның нәтижелері қандай болса да, оларды қабылдау туралы міндеттеме алу: мұндай міндеттемесіз келесі кезеңге өтудің мәні жоқ. Егер маңызды қарсылықтар туындаса, жобалық топтан іс материалдарын жақсартып, қайта көру талап етілуі мүмкін.
Басшылар шу аудитінің дизайнын қабылдағаннан кейін, жобалық топ олардан зерттеу нәтижелеріне қатысты күтулерін сұрауы керек. Олар келесідей сұрақтарды талқылауы тиіс:
«Әр іс бойынша кездейсоқ таңдалған екі жауаптың арасындағы келіспеушілік деңгейі қандай болады деп күтесіз?» «Бизнес тұрғысынан келіспеушіліктің ең жоғары қолайлы деңгейі қандай?» «Бағалаудың кез келген бағытта (тым жоғары немесе төмен) белгілі бір мөлшерге (мысалы, 15%-ға) қате болуының болжамды құны қандай?»
Аудиттің нақты нәтижелері келгенде, олардың есте сақталуы және оған сенуі үшін бұл сұрақтардың жауаптары құжатталуы керек.
Зерттеуді жүргізу
Аудиттелетін бөлімшенің менеджерлеріне басынан бастап олардың бөлімшесі арнайы зерттеу үшін таңдалғаны туралы жалпы ақпарат берілуі керек. Дегенмен, жобаны сипаттау үшін «шу аудиті» терминін қолданбау маңызды. «Шу» және «шулы» деген сөздерден, әсіресе адамдарды сипаттағанда, аулақ болған жөн. Оның орнына «шешім қабылдау процесін зерттеу» сияқты бейтарап терминді қолдану керек.
Бөлімше менеджерлері деректерді жинауға тікелей жауапты болады және жоба менеджері мен жобалық топ мүшелерінің қатысуымен қатысушыларға тапсырма туралы нұсқау береді. Жаттығудың мақсаты қатысушыларға жалпы түрде сипатталуы керек, мысалы: «Ұйым [шешім қабылдаушылардың] өз тұжырымдарына қалай келетініне қызығушылық танытуда».
Зерттеуге қатысатын мамандарға жеке жауаптарды ұйымдағы ешкім, соның ішінде жобалық топ та білмейтініне кепілдік беру өте маңызды. Қажет болса, деректерді анонимдеу үшін сыртқы фирма жалдануы мүмкін. Сондай-ақ, бөлімше үшін ешқандай арнайы салдар болмайтынын, ол тек ұйым атынан пайымдау тапсырмаларын орындайтын бөлімшелердің өкілі ретінде таңдалғанын атап өту маңызды. Нәтижелердің сенімділігін қамтамасыз ету үшін бөлімшедегі барлық білікті мамандар зерттеуге қатысуы тиіс. Бұл жаттығуға жарты жұмыс күнін бөлу қатысушыларды оның маңыздылығына сендіруге көмектеседі.
Барлық қатысушылар жаттығуды бір уақытта орындауы керек, бірақ олар бір-бірінен бөлек отыруы және зерттеу барысында сөйлеспеуі тиіс. Жобалық топ зерттеу кезінде сұрақтарға жауап беру үшін дайын болады.
Талдаулар мен қорытындылар
Жобалық топ әрбір қатысушы бағалаған көптеген істердің статистикалық талдауына, соның ішінде шудың жалпы мөлшерін және оның құрамдас бөліктерін — деңгейлік шу (level noise - әртүрлі адамдардың орташа бағалауларындағы айырмашылық) мен үлгілік шуды (pattern noise - адамдардың нақты істерге беретін бағалау реакцияларының айырмашылығы) өлшеуге жауапты болады. Егер іс материалдары мүмкіндік берсе, ол жауаптардағы статистикалық біржақтылықтарды да анықтайды. Жобалық топ қатысушылар өз ойларын түсіндірген және шешімдеріне көбірек әсер еткен фактілерді көрсеткен сауалнама жауаптарын зерттеу арқылы пайымдаулардағы ауытқулардың себептерін түсінуге тырысатын маңызды тапсырманы орындайды. Деректер үлестірімінің екі шетіндегі экстремалды жауаптарға назар аудара отырып, топ деректердегі заңдылықтарды іздейді. Ол қызметкерлерді оқытудағы, ұйым процедураларындағы және ол өз қызметкерлеріне беретін ақпараттағы ықтимал кемшіліктердің белгілерін іздейді.
Консультант пен ішкі жобалық топ бөлімшеде қабылданатын пайымдаулар мен шешімдерді жақсарту үшін шешім гигиенасы мен біржақтылықты жою принциптерін қолданатын құралдар мен процедураларды әзірлеу үшін бірлесіп жұмыс істейді. Процестің бұл кезеңі бірнеше айға созылуы мүмкін. Сонымен қатар, консультант пен кәсіби топ жоба бойынша есеп дайындап, оны ұйым басшылығына таныстырады.
Осы сәтте ұйым өзінің бөлімшелерінің бірінде сынақ түрінде шу аудитін өткізген болады. Егер бұл талпыныс сәтті деп танылса, атқарушы топ ұйымда шығарылатын пайымдаулар мен шешімдердің сапасын бағалау және жақсарту бойынша ауқымды жұмыстарды бастау туралы шешім қабылдауы мүмкін.
В ҚОСЫМШАСЫ
Шешім бақылаушысына арналған бақылау парағы
Бұл қосымша шешім бақылаушысы пайдаланатын бақылау парағының жалпы мысалын ұсынады (19-тарауды қараңыз). Мұнда берілген бақылау парағы маңызды шешімге әкелетін талқылаудың хронологиялық жүйелілігіне сәйкес келеді.
Бақылау парағының әрбір тармағынан кейін берілген сұрақтар қосымша түсініктемелер береді. Шешім бақылаушылары шешім қабылдау процесін бақылау кезінде өздеріне осы сұрақтарды қоюы керек.
Бұл бақылау парағы дайын күйінде пайдалануға арналмаған. Керісінше, біз бұл бақылау парағы өздерінің біржақтылықты бақылау парағын жасағысы келетін шешім бақылаушылары үшін шабыт пен бастапқы нүкте болады деп үміттенеміз.
Біржақтылықты бақылау парағы
1. ПАЙЫМДАУҒА КӨЗҚАРАС
1a. Ауыстыру

«Топтың дәлелдемелерді таңдауы және талқылау фокусы оларға жүктелген қиын сұрақты жеңіл сұрақпен алмастыруды көрсетті ме? » [/TASK]

«Топ маңызды факторды елеусіз қалдырды ма (немесе маңызды емес факторға артық мән бергендей көрінді ме)? » [/TASK]
1b. Ішкі көзқарас

«Топ өз талқылауларының бір бөлігінде сыртқы көзқарасты қабылдап, абсолютті пайымдаудың орнына салыстырмалы пайымдауды қолдануға шынайы әрекет жасады ма? » [/TASK]
1c. Пікірлердің алуан түрлілігі

«Топ мүшелерінің қателіктерінің өзара байланысты болуына әкелетін ортақ біржақтылықтары бар деп күдіктенуге негіз бар ма? Керісінше, осы топта өкілдігі жоқ маңызды көзқарас немесе сараптама туралы ойлай аласыз ба? » [/TASK]
2. АЛДЫН АЛА ТҰЖЫРЫМДАР ЖӘНЕ УАҚЫТЫНАН БҰРЫН ШЕШІМ ҚАБЫЛДАУ
2a. Бастапқы алдын ала тұжырымдар

«Шешім қабылдаушылардың (кез келгенінің) бір қорытындыдан екіншісіне қарағанда көбірек пайда алу мүмкіндігі бар ма? » [/TASK]

«Біреу бұған дейін белгілі бір қорытындыға келіп қойған ба? Алдын ала теріс пікір (prejudice) бар деп күдіктенуге негіз бар ма? » [/TASK]

«Өзгеше пікірдегілер өз көзқарастарын білдірді ме? » [/TASK]

«Жеңіліске ұшырайтын іс-әрекет бағытына берілгендіктің арту (escalating commitment) қаупі бар ма? » [/TASK]
2b. Уақытынан бұрын шешім қабылдау; шектен тыс бірізділік

«Бастапқыда талқыланған мәселелерді таңдауда кездейсоқ біржақтылық болды ма? » [/TASK]

«Балама нұсқалар толық қарастырылды ма және оларды қолдайтын дәлелдемелер белсенді түрде ізделді ме? » [/TASK]

«Ыңғайсыз мәліметтер немесе пікірлер басып тасталды ма немесе ескерусіз қалды ма? » [/TASK]
3. АҚПАРАТТЫ ӨҢДЕУ
3a. Қолжетімділік және айқындық

«Қатысушылар қандай да бір оқиғаның маңыздылығын оның жақын арада болғанына, драмалық сипатына немесе жеке маңыздылығына байланысты, тіпті ол диагностикалық мәнге ие болмаса да, асыра сілтеп отыр ма? » [/TASK]
3b. Ақпарат сапасына назар аудармау

«Пайымдау анекдоттарға, оқиғаларға немесе ұқсастықтарға (аналогияларға) қатты сүйенді ме? Мәліметтер оларды растады ма? » [/TASK]
3c. Бекіту (Anchoring)

«Дәлдігі немесе маңыздылығы белгісіз сандар қорытынды пайымдауда маңызды рөл атқарды ма? » [/TASK]
3d. Регрессивті емес болжам

«Қатысушылар регрессивті емес экстраполяциялар, бағалаулар немесе болжамдар жасады ма? » [/TASK]
4. ШЕШІМ
4a. Жоспарлау қателігі

«Болжамдар пайдаланылған кезде, адамдар олардың дереккөздері мен негізділігіне күмән келтірді ме? Болжамдарды тексеру үшін сыртқы көзқарас пайдаланылды ма? » [/TASK]

«Белгісіз сандар үшін сенімділік интервалдары пайдаланылды ма? Олар жеткілікті деңгейде кең бе? » [/TASK]
4b. Шығыннан қашу (Loss aversion)

«Шешім қабылдаушылардың тәуекелге деген тәбеті ұйымның тәуекел деңгейімен сәйкес келе ме? Шешім қабылдаушы топ шектен тыс сақ па? » [/TASK]
4c. Қазіргі сәт біржақтылығы (Present bias)

«Есептеулер (соның ішінде пайдаланылған дисконттау мөлшерлемесі) ұйымның қысқа мерзімді және ұзақ мерзімді басымдықтарының тепе-теңдігін көрсете ме? » [/TASK]
С ҚОСЫМШАСЫ
Болжамдарды түзету
Сәйкестендіру болжамдары (matching predictions - қолда бар ақпаратқа сүйеніп, нәтижені асыра бағалау қателігі) — бұл біздің интуитивті сәйкестендіру процесіне сенуімізден туындайтын қателіктер (14-тарауды қараңыз). Біз болжам жасау үшін қолымызда бар ақпаратқа сүйеніп, бұл ақпарат нәтижені мінсіз (немесе өте жоғары деңгейде) болжайтындай әрекет еткенде сәйкестендіру болжамдарын жасаймыз.
«Төрт жасында еркін оқи алатын» Джули туралы мысалды еске түсіріңіз. Сұрақ: оның орташа балы (GPA) қандай? Егер сіз Джулидің колледждегі GPA-ін 3. 8 деп болжасаңыз, сіз интуитивті түрде төрт жасар Джули оқу жасы бойынша өз құрдастарының ең үздік 10%-ына кіреді деп шештіңіз (бірақ үздік 3–5%-ына емес). Содан кейін сіз Джулидің GPA бойынша да өз тобында шамамен 90-шы процентильде болады деп болжадыңыз. Бұл 3. 7 немесе 3. 8 GPA-ге сәйкес келеді — сондықтан бұл жауаптар өте танымал.
Бұл пайымдауды статистикалық тұрғыдан дұрыс емес ететін нәрсе — ол Джули туралы қолжетімді ақпараттың диагностикалық құндылығын шектен тыс асырып жібереді. Пысық төрт жасар бала әрдайым академиялық үздік бола бермейді (және, бақытқа орай, басында оқуда қиналған бала мәңгілікке сыныптың соңында қалмайды).
Шындығында, көп жағдайда ерекше көрсеткіштер уақыт өте келе азая түседі. Керісінше, өте нашар көрсеткіштер жақсарады. Бұл бақылау үшін әлеуметтік, психологиялық немесе тіпті саяси себептерді елестету оңай, бірақ себептер талап етілмейді. Бұл құбылыс — таза статистикалық. Бір немесе басқа бағыттағы экстремалды бақылаулар аз экстремалды бола бастайды, өйткені өткендегі нәтижелер болашақ нәтижелермен толық сәйкес келмейді. Бұл тенденция орташа мәнге регрессия (regression to the mean - шеткі көрсеткіштердің орташа деңгейге жақындау тенденциясы) деп аталады (сондықтан оны ескермейтін сәйкестендіру болжамдары үшін техникалық термин — «регрессивті емес»).
Сандық тұрғыдан алсақ, Джули туралы жасаған пайымдауыңыз, егер оқу жасы GPA-дің мінсіз болжаушысы болса, яғни екі фактор арасындағы корреляция 1-ге тең болса ғана дұрыс болар еді. Бұл анық олай емес.
Дәлірек болуы мүмкін пайымдау жасаудың статистикалық жолы бар. Ол интуитивті емес және тіпті статистикалық дайындығы бар адамдар үшін де қиын. Процедура мынадай. 19-сурет Джулидің мысалымен осыны сипаттайды.

19-СУРЕТ: Интуитивті болжамды орташа мәнге регрессия үшін түзету
Интуитивті болжамыңызды жасаңыз. Джули туралы немесе сізде ақпарат бар кез келген жағдай туралы интуицияңыз құнсыз емес. Сіздің жылдам, «1-жүйе» ойлауыңыз қолыңыздағы ақпаратты болжам шкаласына оңай орналастырады және Джули үшін GPA ұпайын шығарады. Бұл болжам — егер сіздегі ақпарат мінсіз болжаушы болса, сіз жасайтын болжам. Оны жазып қойыңыз.
- Орташа мәнді іздеңіз. Енді бір сәтке шегініп, Джули туралы білетініңізді ұмытыңыз. Егер сіз ол туралы мүлдем ештеңе білмесеңіз, оның GPA-і туралы не айтар едіңіз? Жауап қарапайым: ақпарат болмаған жағдайда, Джулидің GPA-і туралы ең жақсы болжамыңыз оның бітіруші сыныбындағы орташа GPA болады — шамамен 3. 2. Джулиге осылай қарау — жоғарыда айтылған кеңірек принципті, сыртқы көзқарасты қолдану болып табылады. Сыртқы көзқарасты қолданғанда, біз қарастырып жатқан жағдайды бір кластың мысалы ретінде қарастырамыз және сол класс туралы статистикалық тұрғыдан ойлаймыз. Мысалы, Гамбарди мәселесінде сыртқы көзқарасты қолдану бізді жаңа бас директордың табысқа жетуінің базалық деңгейі қандай деген сұраққа әкеледі (4-тарауды қараңыз).
- Қолыңыздағы ақпараттың диагностикалық құндылығын бағалаңыз.
Қолыңыздағы ақпараттың диагностикалық құндылығын бағалаңыз.
Бұл — ең қиын қадам, мұнда сіз өзіңізден: «Мендегі ақпараттың болжамдық құндылығы қандай? » — деп сұрауыңыз керек. Бұл сұрақтың неліктен маңызды екені қазірдің өзінде түсінікті болуы тиіс. Егер сіз Джули туралы тек оның аяқ киімінің өлшемін ғана білсеңіз, бұл ақпаратқа мүлдем салмақ бермей, GPA (Grade Point Average — орташа академиялық балл) ретінде орташа мәндік болжамға сүйенер едіңіз. Екінші жағынан, егер сізде Джулидің әр пәннен алған бағаларының тізімі болса, бұл ақпарат оның GPA-ін (яғни олардың орташа мәнін) мінсіз болжауға мүмкіндік берер еді. Осы екі шеткі жағдайдың арасында көптеген «сұр аймақтар» бар. Егер сізде Джулидің мектептегі ерекше интеллектуалдық жетістіктері туралы мәліметтер болса, бұл ақпарат оның бала кездегі оқу жасына қарағанда әлдеқайда диагностикалық болар еді, бірақ колледждегі бағаларынан төмен болады.
Сіздің мұндағы міндетіңіз — қолдағы деректердің диагностикалық құндылығын (ақпараттың нәтижені болжауға қаншалықты пайдалы екендігі) сіз болжап жатқан нәтижемен корреляция (екі айнымалы арасындағы статистикалық өзара байланыс) түрінде мөлшерлеу. Сирек жағдайларды есептемегенде, бұл сан «жүйрік есеп» (шамамен жасалған жылдам болжам) болуы керек.
Саналы бағалау жасау үшін 12-тарауда келтірілген кейбір мысалдарды еске түсіріңіз. Әлеуметтік ғылымдарда 0,50-ден жоғары корреляция өте сирек кездеседі. Біз мағыналы деп танитын көптеген корреляциялар 0,20 диапазонында болады. Джулидің жағдайында 0,20 корреляциясы, бәлкім, ең жоғарғы шек болуы мүмкін.
Сыртқы көзқарасқа сүйене отырып, интуитивті болжамыңыздың бағытына қарай, қолдағы ақпараттың диагностикалық құндылығын көрсететін дәрежеде түзету жасаңыз.
Қорытынды қадам — сіз шығарған үш санның қарапайым арифметикалық үйлесімі: сіз орташа мәннен бастап, интуитивті болжамыңыздың бағытына қарай, өзіңіз бағалаған корреляцияға пропорционалды түрде түзету енгізуіңіз керек.
Бұл қадам біз жаңа ғана жасаған бақылауды кеңейте түседі: егер корреляция 0 болса, сіз орташа мәнде қалар едіңіз; егер ол 1 болса, сіз орташа мәнді ескермей, сәйкес келетін болжамды сеніммен жасар едіңіз. Олай болса, Джулидің жағдайында GPA бойынша жасауға болатын ең жақсы болжам — оның бала кездегі оқу жасы көрсеткен интуитивті бағалау бағытындағы орташа мәннен 20%-дан аспайтын қашықтықта жатқан мән. Бұл есептеу сізді шамамен 3,3 деген болжамға алып келеді.
Біз Джулидің мысалын қолдандық, бірақ бұл әдісті осы кітапта талқыланған көптеген бағалау мәселелеріне оңай қолдануға болады. Мысалы, жаңа сатушыны жұмысқа қабылдап жатқан және керемет кандидатпен сұхбат өткізген сату жөніндегі вице-президентті қарастырайық. Осы күшті әсерге сүйене отырып, басшы кандидат жұмысының бірінші жылында 1 миллион долларлық сатылым жасайды деп болжайды — бұл жаңа қызметкерлердің бірінші жылындағы орташа көрсеткішінен екі есе көп. Вице-президент бұл болжамды қалай регрессивті ете алады? Есептеу сұхбаттың диагностикалық құндылығына байланысты. Жұмысқа қабылдау сұхбаты жұмыстағы табысты қаншалықты дәл болжайды? Біз қарастырған дәлелдерге сүйенсек, 0,40 корреляциясы өте жомарт бағалау болып табылады. Тиісінше, жаңа қызметкердің бірінші жылдағы сатылымының регрессивті болжамы ең көбі $500 мың + ($1 миллион − $500 мың) × 0,40 = $700 мың болады.
Бұл процесс те интуитивті емес. Мысалдар көрсеткендей, түзетілген болжамдар әрқашан интуитивті болжамдарға қарағанда консервативті болады: олар ешқашан интуитивті болжамдар сияқты шеткі жағдай болмайды, керісінше орташа мәнге жақынырақ, жиі әлдеқайда жақынырақ болады. Егер сіз өз болжамдарыңызды түзетсеңіз, он Гранд Слэм титулын жеңіп алған теннис чемпионы тағы он титул жеңеді деп ешқашан бәс тікпейсіз. Сондай-ақ, құны 1 миллиард доллар болатын өте табысты стартаптың одан бірнеше жүз есе қымбат алпауытқа айналатынын болжамайсыз. Түзетілген болжамдар аутлайерлерге (орташадан тым алшақ, ерекше жағдайлар) бәс тікпейді.
Бұл дегеніміз, ретроспективті (өткенге қарап) бағалағанда, түзетілген болжамдар сөзсіз кейбір айқын сәтсіздіктерге әкеледі. Алайда, болжам жасау ретроспективті түрде орындалмайды. Аутлайерлердің, анықтамасы бойынша, өте сирек кездесетінін есте сақтау керек. Кері қателік әлдеқайда жиі кездеседі: біз аутлайерлер аутлайер болып қала береді деп болжағанда, олар орташа мәнге регрессия (кездейсоқ ауытқулардан кейін көрсеткіштердің орташа деңгейге қайта оралуы) салдарынан әдетте олай болмайды. Сондықтан, мақсат дәлдікті барынша арттыру (яғни MSE — орташа квадраттық қатені азайту) болған кезде, түзетілген болжамдар интуитивті, сәйкестендірілген болжамдардан әлдеқайда тиімді.
«Үкім шығару бойынша шешім қабылдау: Үкім шешімдерінің логикасы және үкімдер арасындағы алшақтықтың деңгейі мен дереккөздері», Journal of Criminal Law and Criminology 72, № 2 [1981], 6-кесте). Дегенмен, біз бұл жерде әрбір істің әсерін кеңірек қарастырамыз, соның ішінде судьяларға ұсынылған барлық белгілерді — мысалы, айыпталушының соттылығы болған-болмағанын немесе қылмыс жасау кезінде қару қолданылғанын ескереміз. Біздің анықтамамыз бойынша, бұл белгілердің барлығы шу емес, іс дисперсиясының (істер арасындағы объективті айырмашылықтар) бір бөлігі болып табылады. Соған сәйкес, біз әр істің ерекшеліктері арасындағы өзара әрекеттесулерді іс дисперсиясына қайта біріктірдік (бұл жалпы дисперсияның 11%-ын құрайды; Бартоломео және басқалары, 10-кестені қараңыз). Нәтижесінде біз дисперсия үлестерін келесідей қайта анықтаймыз: іс дисперсиясы — 56%, судьяның негізгі әсері (деңгейлік шу — судьяның жалпы қаталдық деңгейі) — 21%, ал жалпы дисперсиядағы өзара әрекеттесулер — 23%. Осылайша, жүйелік шу жалпы дисперсияның 44%-ын құрайды.
- 89-бетте, әр іс бойынша орташа үкімдер көрсетілген кестеде: дисперсия 15-ке тең. Егер бұл жалпы дисперсияның 56%-ы болса, онда жалпы дисперсия 26,79-ды, ал жүйелік шудың дисперсиясы 11,79-ды құрайды. Осы дисперсияның шаршы түбірі типтік іс үшін стандартты ауытқу болып табылады, ол 3,4 жылға тең.
- Осы дисперсияның шаршы түбірі судьяның деңгейлік шуына тиесілі стандартты ауытқуды береді, ол 2,4 жылды құрайды.
- 3,4 жыл: Бұл көрсеткіш он алты іс бойынша үкімдер дисперсиясы орташа мәнінің шаршы түбірі болып табылады. Біз оны алдыңғы ескертуде түсіндірілгендей есептедік.
- Қарапайым аддитивті логика: Аддитивтілік гипотезасы (көрсеткіштерді жай ғана қосуға негізделген жорамал) судьяның қаталдығы түрме мерзіміне тұрақты мөлшерді қосады деп есептейді. Бұл гипотезаның дұрыс болуы екіталай: судьяның қаталдығы орташа үкімге пропорционалды мөлшерді қосуы ықтималырақ. Бұл мәселе түпнұсқа есепте ескерілмеген және оның маңыздылығын бағалау мүмкін емес.
- «Судьялар арасындағы заңдылыққа негізделген айырмашылықтар»: Бартоломео және басқалары, «Үкім шығару бойынша шешім қабылдау», 23.
- Шамамен тең дәрежеде: Келесі теңдеу орындалады: (Жүйелік шу)² = (Деңгейлік шу)² + (Паттерн шу)². Кестеде жүйелік шу 3,4 жылды, ал деңгейлік шу 2,4 жылды құрайтыны көрсетілген. Бұдан паттерн шудың да шамамен 2,4 жыл екені шығады. Есептеу иллюстрация ретінде берілген — нақты мәндер дөңгелектеу қателіктеріне байланысты сәл өзгеше болуы мүмкін.
7-ТАРАУ
- Барлық уақыттағы ең үздік нәтиже: [LINK url=”http://www. iweblists. com/sports/basketball/FreeThrowPercent_c. html”]http://www. iweblists. com/sports/basketball/FreeThrowPercent_c. html[LINK] сілтемесін қараңыз, 27 желтоқсан 2020 жылы тексерілді.
- Шакил О'Нил: [LINK url=”https://www. basketball-reference. com/players/o/onealsh01. html”]https://www. basketball-reference. com/players/o/onealsh01. html[LINK] сілтемесін қараңыз, 27 желтоқсан 2020 жылы тексерілді.
- Шарап сарапшылары: Р. Т. Ходжсон, «АҚШ-тың ірі шарап байқауындағы судьялардың сенімділігін зерттеу», Journal of Wine Economics 3, № 2 (2008): 105–113.
- Бағдарламалық қамтамасыз ету бойынша консультанттар: Стейн Гримстад және Магне Йоргенсен, «Бағдарламалық жасақтаманы әзірлеуге жұмсалатын күш-жігерді сарапшылық бағалаудың сәйкессіздігі», Journal of Systems and Software 80, № 11 (2007): 1770–1777.
- Өздерімен келісу: Роберт Х. Эштон, «Кәсіби пайымдаудың тест-ретест сенімділігін зерттеуге шолу және талдау», Journal of Behavioral Decision Making 294, № 3 (2000): 277–294. Айта кететін жайт, автор өзі қарастырған қырық бір зерттеудің бірде-бірі жағдайлық шуды (бір адамның бір мәселе бойынша әртүрлі уақытта әртүрлі шешім қабылдауы) бағалауға арналмағанын атап өткен: «Барлық жағдайларда сенімділікті өлшеу басқа зерттеу мақсаттарының қосымша өнімі болды» (Эштон, 279). Бұл пікір жағдайлық шуды зерттеуге деген қызығушылықтың салыстырмалы түрде жақында пайда болғанын көрсетеді.
- Дұрыс жауап: Орталық барлау басқармасы (CIA), The World Factbook (Вашингтон, Колумбия округі: Орталық барлау басқармасы, 2020). Көрсетілген дерек ауадан танылатын барлық әуежайларды немесе аэродромдарды қамтиды. Ұшу-қону жолақтары төселген немесе төселмеген болуы мүмкін, сондай-ақ жабылған немесе қараусыз қалған нысандарды да қамтуы мүмкін.
- Эдвард Вул және Гарольд Пашлер: Эдвард Вул және Гарольд Пашлер, «Ішкі топ: Жеке тұлғалардағы ықтималдық көріністер».
- Шындыққа жақынырақ: Джеймс Шуровьески, Топтың даналығы: Неліктен көпшілік азшылықтан ақылдырақ және ұжымдық даналық бизнесті, экономиканы, қоғамдар мен ұлттарды қалай қалыптастырады (Нью-Йорк: Doubleday, 2004).
- Шуы азырақ: Орташаланған пайымдаулардың стандартты ауытқуы (біздің шуды өлшеу бірлігіміз) пайымдаулар санының шаршы түбіріне пропорционалды түрде азаяды.
- «Сіз ұта аласыз»: Вул және Пашлер, «Ішкі топ», 646.
- Стефан Герцог және Ральф Хертвиг: Стефан М. Герцог және Ральф Хертвиг, «Екі рет ойлан, сосын: Диалектикалық бутстрапингте біріктіру ме, әлде таңдау ма? », Journal of Experimental Psychology: Learning, Memory, and Cognition 40, № 1 (2014): 218–232.
- «Жасалған жауаптар»: Вул және Пашлер, «Ішкі топты өлшеу», 647.
- Джозеф Форгас: Джозеф П. Форгас, «Тұлғааралық мінез-құлыққа аффективті әсерлер», Psychological Inquiry 13, № 1 (2002): 1–28.
- «Сол бір күлкі... »: Форгас, «Аффективті әсерлер», 10.
- Өзгермелі келіссөз жүргізушілер: А. Филипович, С. Барсаде және С. Мелвани, «Эмоциялық ауысуларды түсіну: Келіссөздердегі эмоциялардың өзгеруінің тұлғааралық салдары», Journal of Personality and Social Psychology 101, № 3 (2011): 541–556.
- Қатысушылар қысқа философиялық эссе оқыды: Джозеф П. Форгас, «Ол философқа мүлдем ұқсамайды...? Әсерді қалыптастырудағы гало-эффектіге аффективті әсерлер», European Journal of Social Psychology 41, № 7 (2011): 812–817.
- Жалған терең мәлімдемелер: Гордон Пенникук, Джеймс Аллан Чейн, Натаниэль Барр, Дерек Дж. Келер және Джонатан А. Фугельсанг, «Жалған терең сандырақты қабылдау және анықтау туралы», Judgment and Decision Making 10, № 6 (2015): 549–563.
- Сандырақ туралы: Гарри Франкфурт, On Bullshit (Принстон, Нью-Джерси: Princeton University Press, 2005).
- «Сыртынан әсерлі көрінетін тұжырымдар»: Пенникук және басқалары, «Жалған терең сандырақ», 549.
- Сенгіштігі жоғарырақ: Джозеф П. Форгас, «Бақытты сенушілер мен мұңды скептиктер? Сенгіштікке аффективті әсерлер», Current Directions in Psychological Science 28, № 3 (2019): 306–313.
- Куәгерлер: Джозеф П. Форгас, «Куәгерлердің жадына көңіл-күйдің әсері: Жалған ақпаратқа бейімділікке аффективті әсерлер», Journal of Experimental Social Psychology 41, № 6 (2005): 574–588.
- Көпір мәселесі: Пьеркарло Вальдесоло және Дэвид Дестено, «Эмоциялық контекстті манипуляциялау моральдық пайымдауды қалыптастырады», Psychological Science 17, № 6 (2006): 476–477.
- Ұзақ күннің соңындағы опиоидтар: Ханна Т. Непраш және Майкл Л. Барнетт, «Бастапқы медициналық көмек клиникасына қабылдау уақытының опиоидтарды тағайындаумен байланысы», JAMA Network Open 2, № 8 (2019); Линдси М. Филпот және басқалары, «Күннің уақыты бастапқы медициналық көмекте бел ауруы үшін опиоидтарды тағайындаумен байланысты», Journal of General Internal Medicine 33 (2018): 1828.
- Антибиотиктер: Джеффри А. Линдер және басқалары, «Күннің уақыты және антибиотиктерді тағайындау туралы шешім», JAMA Internal Medicine 174, № 12 (2014): 2029–2031.
- Тұмауға қарсы егулер: Ребекка Х. Ким және басқалары, «Клиникаға қабылдау уақыты бойынша тұмауға қарсы вакцинациядағы ауытқулар және вакцинацияны арттыру үшін электронды денсаулық сақтау жазбасындағы белсенді таңдау интервенциясы», JAMA Network Open 1, № 5 (2018): 1–10.
- Жаман ауа райы: Жадының жақсаруы туралы түсініктеме алу үшін Джозеф П. Форгас, Лиз Гольденберг және Кристиан Ункельбах, «Жаман ауа райы жадыңды жақсарта ала ма? Нақты өмірдегі жадыға табиғи көңіл-күй әсерлерін байқатпай зерттеу», Journal of Experimental Social Psychology 45, № 1 (2008): 254–257 жұмысын қараңыз. Күн сәулесі туралы түсініктеме алу үшін Дэвид Хиршлейфер және Тайлер Шумвей, «Қайырлы күн, шуақ: Акциялардың қайтарымдылығы және ауа райы», Journal of Finance 58, № 3 (2003): 1009–1032 жұмысын қараңыз.
- «Бұлттар „ботаниктерді“ тартымды етеді»: Ури Симонсон, «Бұлттар „ботаниктерді“ тартымды етеді: Шешім қабылдауға кездейсоқ факторлардың әсерінің далалық дәлелдері», Journal of Behavioral Decision Making 20, № 2 (2007): 143–152.
- Ойыншы қателігі: Даниэль Чен және басқалары, «Ойыншы қателігі жағдайында шешім қабылдау: Баспана беру жөніндегі судьялардың, несие мамандарының және бейсбол төрешілерінің деректері», Quarterly Journal of Economics 131, № 3 (2016): 1181–1242.
- Баспана беру: Джая Рамджи-Ногалес, Эндрю И. Шенхольц және Филип Шраг, «Босқындар рулеткасы: Баспана беру туралы сот шешімдеріндегі алшақтықтар», Stanford Law Review 60, № 2 (2007).
- Жадының өнімділігі: Майкл Дж. Кахана және басқалары, «Адам жадындағы өзгергіштік жұмбағы», Journal of Experimental Psychology: Learning, Memory, and Cognition 44, № 12 (2018): 1857–1863.
8-ТАРАУ
- Музыканы жүктеп алуды зерттеу: Мэттью Дж. Салганик, Питер Шеридан Доддс және Дункан Дж. Уоттс, «Жасанды мәдени нарықтағы теңсіздік пен болжаусыздықты эксперименттік зерттеу», Science 311 (2006): 854–856.
- Танымалдық өзін-өзі күшейтеді: Салганик және Уоттс, «Топты адастыру».
- Көптеген басқа салаларда: Майкл Мэйси және басқалары, «Пікір каскадтары және партиялық полярланудың болжаусыздығы», Science Advances (2019): 1–8.
- Әлеуметтанушы Майкл Мэйси: Майкл Мэйси және басқалары, «Пікір каскадтары».
- Веб-сайттардағы пікірлер: Лев Мучник және басқалары, «Әлеуметтік ықпалдың бұрмалануы: Рандомизацияланған эксперимент», Science 341, № 6146 (2013): 647–651.
- Зерттеулер көрсеткендей: Ян Лоренц және басқалары, «Әлеуметтік ықпал топтың даналығы әсеріне қалай нұқсан келтіруі мүмкін», Proceedings of the National Academy of Sciences 108, № 22 (2011): 9020–9025.
- Салыстырмалы эксперимент: Даниэль Канеман, Дэвид Шкаде және Касс Санстейн, «Ортақ ашу-ыза және тұрақсыз сыйақылар: Жазалаушы шығындардың психологиясы», Journal of Risk and Uncertainty 16 (1998): 49–86.
- Бес жүз жалған алқабилер соты: Дэвид Шкаде, Касс Р. Санстейн және Даниэль Канеман, «Доллар туралы кеңесу: Қатаңдыққа ауысу», Columbia Law Review 100 (2000): 1139–1175.
- Үйлесімділік пайызы: Үйлесімділік пайызы (PC) Кендаллдың W коэффициентімен тығыз байланысты, ол үйлесімділік коэффициенті ретінде де белгілі.
- Бой және аяқ өлшемі: Канвал Камбой және басқалары, «Жеке адамның аяқ ұзындығы мен бойы арасындағы корреляцияны зерттеу және аяқ ұзындығы бойынша бойды бағалау үшін регрессия формулаларын шығару», International Journal of Research in Medical Sciences 6, № 2 (2018): 528.
- 1-кесте PC көрсетеді: PC бірлескен үлестірім бивариатты-нормальды деген болжам негізінде есептеледі. Кестеде көрсетілген мәндер осы жорамалға негізделген шамаланған мәндер. Біз бұл кестені дайындағаны үшін Джулиан Пэрриске алғыс айтамыз.
9-ТАРАУ
- Жұмыс өнімділігін болжауды нақты зерттеу: Мартин С. Ю және Натан Р. Кунцел, «Пайымдау дәйектілігінің шегін кеңейту: Кездейсоқ өлшемдік схемаларды сарапшылық пайымдаулармен салыстыру», Personnel Assessment and Decisions 6, № 2 (2020): 1–10. Сарапшылар қол жеткізген . 15 корреляциясы зерттелген үш үлгінің орташаланған мәні болып табылады, барлығы 847 істі қамтиды.
- Салмақты орташа мән: Салмақты орташа мәнді құрудың алғышарты — барлық болжаушылардың салыстырмалы бірліктермен өлшенуі. Бұл талап біздің кіріспе мысалымызда орындалды (барлық рейтингтер 0-ден 10-ға дейінгі шкалада болды), бірақ бұл әрдайым бола бермейді. Мысалы, өнімділік болжаушылары сұхбат алушының 0-ден 10-ға дейінгі бағасы, тиісті тәжірибе жылдарының саны және кәсіби шеберлік тестінің балы болуы мүмкін. Көптік регрессия (бірнеше тәуелсіз айнымалылардың нәтижеге әсерін талдайтын статистикалық әдіс) бағдарламасы оларды біріктірмес бұрын барлық болжаушыларды стандартты балдарға (көрсеткіштің орташа мәннен қаншалықты ауытқитынын көрсететін өлшем) айналдырады.
- Үлкен салмақ алады: Көптік регрессияның маңызды ерекшелігі — әрбір болжаушының оңтайлы салмағы басқа болжаушыларға байланысты болады. Егер бір болжаушы екіншісімен тығыз корреляцияланса, ол бірдей үлкен салмақ алмауы керек — бұл «екі есе есептеудің» бір түрі болар еді.
- «Жұмыс аты... »: Робин М. Хогарт және Наталия Карелайя, «Пайымдаудың эвристикалық және сызықтық модельдері: Сәйкестік ережелері мен орта», Psychological Review 114, № 3 (2007): 734.
- Қарапайым құрылым: Бұл тұрғыда кеңінен қолданылатын зерттеу негізі — пайымдаудың линзалық моделі (адамдардың қоршаған ортадағы жанама белгілер арқылы шешім қабылдауын түсіндіретін модель). Кеннет Р. Хаммонд, «Ықтималдық жұмыс және клиникалық әдіс», Psychological Review 62, № 4 (1955): 255–262.
- Пол Э. Миль, Клиникалық және статистикалық болжау: Теориялық талдау және дәлелдемелерге шолу (Миннеаполис: University of Minnesota Press, 1954).
- Фрейдтің суреті: Пол Э. Миль, Клиникалық және статистикалық болжау (Нортвейл, Нью-Джерси: Aronson, 1996), алғысөз.
- Эрудит: «Пол Э. Миль», Эд Линдзи редакциясымен, Автобиографиядағы психология тарихы, 1989.
- «Массивті және дәйекті»: «Пол Э. Миль», Автобиографиядағы психология тарихы, ред. Эд Линдзи (Вашингтон, Колумбия округі: Америкалық психологиялық қауымдастық, 1989), 362.
- 2000 жылғы шолу: Уильям М. Гроув және басқалары, «Клиникалық және механикалық болжау: Мета-талдау», Psychological Assessment 12, № 1 (2000): 19–30.
- «Жеке» ақпаратқа қолжетімділік: Уильям М. Гроув және Пол Э. Миль, «Бейресми және ресми болжау процедураларының салыстырмалы тиімділігі: Клиникалық-статистикалық қайшылық», Psychology, Public Policy, and Law 2, № 2 (1996): 293–323.
- 1960 жылдардың соңында: Льюис Голдберг, «Адам адам моделіне қарсы», Psychological Bulletin 73, № 6 (1970): 422–432.
- Ондай ештеңе жоқ: Милтон Фридман және Леонард Дж. Сэвидж, «Тәуекелге байланысты таңдауларды пайдалылық талдауы», Journal of Political Economy 56, № 4 (1948): 279–304.
- Бұл корреляция: Карелайя және Хогарт, «Сызықтық пайымдаудың детерминанттары», 411, 1-кесте.
- Ерте репликация: Нэнси Уиггинс және Эйлин С. Кохен, «Адам адам моделіне қарсы: Магистратурадағы табысты болжау», Journal of Personality and Social Psychology 19, № 1 (1971): 100–106.
- Елу жылдық шолу: Карелайя және Хогарт, «Сызықтық пайымдаудың детерминанттары».
- Болжау дәлдігін жақсарту: Болжаушының кемелсіз сенімділігі үшін корреляция коэффициентін түзету бәсеңдеуді түзету (өлшеу қателіктерін ескере отырып, айнымалылар арасындағы шынайы байланысты анықтау әдісі) ретінде белгілі. Формула: Түзетілген rxy = rxy / √ rxx.
- Мартин Ю мен Натан Кунцелдің зерттеуі: Ю және Кунцел, «Пайымдау дәйектілігі».
- Кездейсоқ формулалар: Біз келесі тарауда тең салмақты және кездейсоқ салмақты модельдерді толығырақ талқылаймыз.
10-ТАРАУ
- Клиникалық пайымдаулардан әлдеқайда жоғары: Робин М. Доус және Бернард Корриган, «Шешім қабылдаудағы сызықтық модельдер», Psychological Bulletin 81, № 2 (1974): 95–106.
- «Статистикалық интуицияға қайшы»: Джейсон Дана, «Дұрыс емес сызықтық модельдерді не қозғайды? », Робин М. Доус құрметіне арналған эсселер жинағында, ред. Йоахим И. Крюгер, 71–89 (Нью-Йорк: Psychology Press, 2008), 73.
- Ұқсас нәтижелер: Джейсон Дана және Робин М. Доус, «Әлеуметтік ғылымдардағы болжау үшін регрессияға қарапайым баламалардың артықшылығы», Journal of Educational and Behavior Statistics 29 (2004): 317–331.
- «Бұл маңызды емес»: Говард Вайнер, «Сызықтық модельдердегі коэффициенттерді бағалау: Бұл мүлдем маңызды емес», Psychological Bulletin 83, № 2 (1976): 213–217.
- «Бізге қажет емес»: Дана, «Дұрыс емес сызықтық модельдерді не қозғайды? », 72.
- Нәтижемен корреляция: Мартин С. Ю және Натан Р. Кунцел, «Пайымдау дәйектілігінің шегін кеңейту», Personnel Assessment and Decisions 6, № 2 (2020): 1–10. Алдыңғы тараудағыдай, хабарланған корреляция зерттелген үш үлгінің орташаланған мәні болып табылады.
- «Төзімді сұлулық»: Робин М. Доус, «Шешім қабылдаудағы дұрыс емес сызықтық модельдердің төзімді сұлулығы», American Psychologist 34, № 7 (1979): 571–582.
- «Бүкіл қулық»: Доус және Корриган, «Шешім қабылдаудағы сызықтық модельдер», 105.
- Зерттеушілер тобы: Джонбин Юнг және басқалары, «Сарапшылық классификацияларды бағыттауға арналған қарапайым ережелер», Journal of the Royal Statistical Society, № 183 (2020): 771–800.
- Бөлек топ: Юлия Дрессел және Хани Фарид, «Қайталама қылмысты болжаудың дәлдігі, әділдігі және шектеулері», Science Advances 4, № 1 (2018): 1–6.
- Тек екі кіріс дерегі: Бұл екі мысал айнымалылардың өте аз жиынтығына негізделген сызықтық модельдер болып табылады. «Дұрыс емес модельдің» тағы бір түрі — жалғыз айнымалы ережесі (басқа факторларды ескермей, тек бір көрсеткішке сүйенетін шешім қабылдау әдісі).
- Жақсы құжатталған: П. Жандро және басқалары, «Ересек қылмыскерлердің қайталама қылмыс жасауын болжаушылардың мета-талдауы», Criminology 34 (1996).
- Өте үлкен деректер жиынтығы: Бұл контекстегі көлемді бақылаулар санының болжаушылар санына қатынасы ретінде түсіну керек. Доус оңтайлы салмақтар бірлік салмақтардан жақсырақ болуы үшін бұл қатынас кемінде 15 немесе 20-ның 1-ге қатынасындай болуы керек деп есептеді. Дана мен Доус кросс-валидацияда (модельді жаңа деректерде тексеру әдісі) бұл межені 100-дің 1-ге қатынасына дейін көтерді.
- Басқа топ: Дж. Клейнберг және басқалары, «Адам шешімдері және машиналық болжамдар», Quarterly Journal of Economics 133 (2018): 237–293.
- Машиналық оқыту алгоритмін үйретті: Алгоритм деректердің бір бөлігінде үйретіліп, содан кейін кездейсоқ таңдалған басқа бөлігінде нәтижелерді болжау қабілеті бойынша бағаланды.
- «Машиналық оқыту алгоритмі табады»: Клейнберг және басқалары, «Адам шешімдері», 16.
- Жүйелік шуға мыналар кірді: Грегори Стоддард, Йенс Людвиг және Сендхил Муллайнатан, авторлармен электронды пошта арқылы алмасу, маусым–шілде 2020 жыл.
бағдарламалық жасақтама инженерлерін жұмысқа қабылдау: B. Cowgill, “Bias and Productivity in Humans and Algorithms: Theory and Evidence from Résumé Screening,” Smith Entrepreneurship Research Conference-те ұсынылған баяндама, Колледж-Парк, Мэриленд, 21 сәуір, 2018 жыл.
1996 жылғы мақала: William M. Grove and Paul E. Meehl, “Comparative Efficiency of Informal (Subjective, Impressionistic) and Formal (Mechanical, Algorithmic) Prediction Procedures: The Clinical-Statistical Controversy,” Psychology, Public Policy, and Law 2, no. 2 (1996): 293–323.
алгоритмді артық көру: Jennifer M. Logg, Julia A. Minson, and Don A. Moore, “Algorithm Appreciation: People Prefer Algorithmic to Human Judgment,” Organizational Behavior and Human Decision Processes 151 (сәуір 2018): 90–103.
оның қателік жіберетінін көрген бойда: B. J. Dietvorst, J. P. Simmons, and C. Massey, “Algorithm Aversion: People Erroneously Avoid Algorithms After Seeing Them Err,” Journal of Experimental Psychology General 144 (2015): 114–126. Сондай-ақ мынаны қараңыз: A. Prahl and L. Van Swol, “Understanding Algorithm Aversion: When Is Advice from Automation Discounted?,” Journal of Forecasting 36 (2017): 691–702.
Егер бұл күту орындалмаса: M. T. Dzindolet, L. G. Pierce, H. P. Beck, and L. A. Dawe, “The Perceived Utility of Human and Automated Aids in a Visual Detection Task,” Human Factors: The Journal of the Human Factors and Ergonomics Society 44, no. 1 (2002): 79–94; K. A. Hoff and M. Bashir, “Trust in Automation: Integrating Empirical Evidence on Factors That Influence Trust,” Human Factors: The Journal of the Human Factors and Ergonomics Society 57, no. 3 (2015): 407–434; және P. Madhavan and D. A. Wiegmann, “Similarities and Differences Between Human–Human and Human–Automation Trust: An Integrative Review,” Theoretical Issues in Ergonomics Science 8, no. 4 (2007): 277–301.
11-ТАРАУ
Менеджерлік шешім қабылдау саласындағы зерттеулер: E. Dane and M. G. Pratt, “Exploring Intuition and Its Role in Managerial Decision Making,” Academy of Management Review 32, no. 1 (2007): 33–54; Cinla Akinci and Eugene Sadler-Smith, “Intuition in Management Research: A Historical Review,” International Journal of Management Reviews 14 (2012): 104–122; және Gerard P. Hodgkinson et al., “Intuition in Organizations: Implications for Strategic Management,” Long Range Planning 42 (2009): 277–297.
Бір шолу: Hodgkinson et al., “Intuition in Organizations,” 279.
жақын арадағы шолу: Nathan Kuncel et al., “Mechanical Versus Clinical Data Combination in Selection and Admissions Decisions: A Meta-Analysis,” Journal of Applied Psychology 98, no. 6 (2013): 1060–1072. Сондай-ақ кадрлық шешімдерді талқылау үшін 24-тарауды қараңыз.
Шамадан тыс сенімділік: Don A. Moore, Perfectly Confident: How to Calibrate Your Decisions Wisely (New York: HarperCollins, 2020).
«пікір білдіру немесе кеңес беру»: Philip E. Tetlock, Expert Political Judgment: How Good Is It? How Can We Know? (Princeton, NJ: Princeton University Press, 2005), 239 және 233.
136 зерттеуге жасалған шолу: William M. Grove et al., “Clinical Versus Mechanical Prediction: A Meta-Analysis,” Psychological Assessment 12, no. 1 (2000): 19–30.
жүрек талмасы: Sendhil Mullainathan and Ziad Obermeyer, “Who Is Tested for Heart Attack and Who Should Be: Predicting Patient Risk and Physician Error,” 2019. NBER Working Paper 26168, National Bureau of Economic Research.
өздері өте белгісіз деп санайтын жағдайларда: Weston Agor, “The Logic of Intuition: How Top Executives Make Important Decisions,” Organizational Dynamics 14, no. 3 (1986): 5–18; Lisa A. Burke and Monica K. Miller, “Taking the Mystery Out of Intuitive Decision Making,” Academy of Management Perspectives 13, no. 4 (1999): 91–99.
алгоритмге сенуге дайын: Poornima Madhavan and Douglas A. Wiegmann, “Effects of Information Source, Pedigree, and Reliability on Operator Interaction with Decision Support Systems,” Human Factors: The Journal of the Human Factors and Ergonomics Society 49, no. 5 (2007).
12-ТАРАУ
ерекше мақала: Matthew J. Salganik et al., “Measuring the Predictability of Life Outcomes with a Scientific Mass Collaboration,” Proceedings of the National Academy of Sciences 117, no. 15 (2020): 8398–8403.
жалпы іріктеме: бұған 4242 отбасы кірді, өйткені Fragile Families зерттеуіндегі кейбір отбасылар құпиялылық себептеріне байланысты бұл талдаудан шығарылды.
.22 корреляциясы : Дәлдікті бағалау үшін байқау ұйымдастырушылары біз 1-бөлімде таныстырған көрсеткішті қолданды: орташа квадраттық қателік немесе MSE. Салыстыруды жеңілдету үшін олар әр модельдің MSE көрсеткішін «пайдасыз» болжау стратегиясымен (әрбір жеке жағдай жаттығу жиынтығының орташа мәнінен ерекшеленбейді деген бірыңғай болжам) салыстырды. Ыңғайлы болу үшін біз олардың нәтижелерін корреляция коэффициенттеріне айналдырдық. Корреляция (екі айнымалының арасындағы өзара байланыс) мен MSE r² = (Var (Y) − MSE) / Var (Y) өрнегі арқылы байланысады, мұндағы Var (Y) — нәтиже айнымалысының дисперсиясы, ал (Var (Y) − MSE) — болжанған нәтижелердің дисперсиясы.
Әлеуметтік психологиядағы зерттеулерге жасалған ауқымды шолу: F. D. Richard et al., “One Hundred Years of Social Psychology Quantitatively Described,” Review of General Psychology 7, no. 4 (2003): 331–363.
708 зерттеуге жасалған шолу: Gilles E. Gignac and Eva T. Szodorai, “Effect Size Guidelines for Individual Differences Researchers,” Personality and Individual Differences 102 (2016): 74–78.
«Зерттеушілер келісуі керек»: Бір ескерту бар. Бұл зерттеу дизайн бойынша бар сипаттамалық деректер жиынтығын пайдаланады, ол өте үлкен, бірақ нақты нәтижелерді болжау үшін арнайы жасалмаған. Бұл Тетлоктың зерттеуіндегі өздеріне қажетті кез келген ақпаратты еркін пайдалана алған сарапшылардан маңызды айырмашылығы болып табылады. Мысалы, деректер қорында жоқ, бірақ жинауға болатын үйден шығарудың болжаушыларын (предикторларын) анықтау мүмкін болуы мүмкін. Демек, зерттеу үйден шығарудың және басқа да нәтижелердің ішкі мәнінде қаншалықты болжап болмайтынын емес, көптеген әлеуметтанушылар қолданатын осы деректер жиынтығы негізінде олардың қаншалықты болжап болмайтынын дәлелдейді.
себеп-салдарлық тізбек: Jake M. Hofman et al., “Prediction and Explanation in Social Systems,” Science 355 (2017): 486–488; Duncan J. Watts et al., “Explanation, Prediction, and Causality: Three Sides of the Same Coin?,” қазан 2018, 1–14, Center for Open Science арқылы қолжетімді, https://osf.io/bgwjc.
санамызға табиғи түрде келеді: Осыған ұқсас айырмашылық экстенционалды ойлауды экстенционалды емес немесе интенционалды ойлауға қарсы қояды. Amos Tversky and Daniel Kahneman, “Extensional Versus Intuitive Reasoning: The Conjunction Fallacy in Probability Judgment,” Psychological Review 4 (1983): 293–315.
өткенге бағытталған: Daniel Kahneman and Dale T. Miller, “Norm Theory: Comparing Reality to Its Alternatives,” Psychological Review 93, no. 2 (1986): 136–153.
өткенге көз салу (hindsight) бойынша классикалық зерттеу: Baruch Fischhoff, “An Early History of Hindsight Research,” Social Cognition 25, no. 1 (2007): 10–13, doi:10.1521/soco.2007.25.1.10; Baruch Fischhoff, “Hindsight Is Not Equal to Foresight: The Effect of Outcome Knowledge on Judgment Under Uncertainty,” Journal of Experimental Psychology: Human Perception and Performance 1, no. 3 (1975): 288. Hindsight — болған оқиғаны алдын ала болжауға болатын еді деп санау.
2-жүйе: Daniel Kahneman, Thinking, Fast and Slow. New York: Farrar, Straus and Giroux, 2011.
13-ТАРАУ
Алғашқы төрт онжылдық: Daniel Kahneman, Thinking, Fast and Slow (New York: Farrar, Straus and Giroux, 2011).
айғақтар мынаны көрсетеді: Бір ескерту. Пайымдау ауытқуларын зерттейтін психологтар 10-суретте көрсетілгендей әр топта бес қатысушының болуымен шектелмейді, бұның өте орынды себебі бар: пайымдаулар шулы болғандықтан, әрбір эксперименталды топтың нәтижелері 11-суретте көрсетілгендей сирек жинақталады. Адамдардың әрбір ауытқуға бейімділігі әртүрлі және олар тиісті айнымалыларды толығымен елеусіз қалдырмайды. Мысалы, қатысушылардың саны өте көп болса, сіз ауқымға сезімталдықтың (scope insensitivity) мінсіз емес екенін анықтай аласыз: Гамбардидің қызметтен кетуінің орташа ықтималдығы екі жылға қарағанда үш жыл үшін сәл жоғары болады. Соған қарамастан, ауқымға сезімталдық сипаттамасы орынды, өйткені айырмашылық болуы тиіс мәннің өте аз бөлігін ғана құрайды.
бірнеше эксперименттер: Daniel Kahneman et al., eds., Judgment Under Uncertainty: Heuristics and Biases (New York: Cambridge University Press, 1982), chap. 6; Daniel Kahneman and Amos Tversky, “On the Psychology of Prediction,” Psychological Review 80, no. 4 (1973): 237–251.
бас директорлардың (CEO) ауысуы туралы бағалаулар: Қараңыз, мысалы: Steven N. Kaplan and Bernadette A. Minton, “How Has CEO Turnover Changed?,” International Review of Finance 12, no. 1 (2012): 57–87. Сондай-ақ мынаны қараңыз: Dirk Jenter and Katharina Lewellen, “Performance-Induced CEO Turnover,” Harvard Law School Forum on Corporate Governance, 2 қыркүйек, 2020 жыл, https://corpgov.law.harvard.edu/2020/09/02/performance-induced-ceo-turnover.
Шешуші сәтте: J. W. Rinzler, The Making of Star Wars: Return of the Jedi: The Definitive Story (New York: Del Rey, 2013), 64.
сценарийді әзірлеу: Cass Sunstein, The World According to Star Wars (New York: HarperCollins, 2016).
таңдамалы және бұрмаланған: Біз мұнда пайымдау басталған кезде алдын ала тұжырымның (prejudgment) болуының қарапайым жағдайын атап өтіп отырмыз. Іс жүзінде, тіпті мұндай алдын ала тұжырым болмаса да, қарапайымдылық пен үйлесімділікке бейімділіктің әсерінен айғақтар жиналған сайын белгілі бір тұжырымға қарай ауытқу пайда болуы мүмкін. Алғашқы тұжырым пайда болған кезде, растау ауытқуы (confirmation bias) жаңа айғақтарды жинау мен түсіндіруді соның пайдасына бұрмалайды.
тіпті пайымдау кезінде де: Бұл бақылау «сенім ауытқуы» (belief bias) деп аталды. Қараңыз: J. St. B. T. Evans, Julie L. Barson, and Paul Pollard, “On the Conflict between Logic and Belief in Syllogistic Reasoning,” Memory & Cognition 11, no. 3 (1983): 295–306.
Әдеттегі көрсетілімде: Dan Ariely, George Loewenstein, and Drazen Prelec, “‘Coherent Arbitrariness’: Stable Demand Curves Without Stable Preferences,” Quarterly Journal of Economics 118, no. 1 (2003): 73–105.
келіссөздерде: Adam D. Galinsky and T. Mussweiler, “First Offers as Anchors: The Role of Perspective-Taking and Negotiator Focus,” Journal of Personality and Social Psychology 81, no. 4 (2001): 657–669.
шамадан тыс жүйелілік: Solomon E. Asch, “Forming Impressions of Personality,” Journal of Abnormal and Social Psychology 41, no. 3 (1946): 258–290, бұл құбылысты суреттеу үшін алғаш рет әртүрлі ретпен берілген бірқатар сын есімдерді қолданды.
ашық зерттеуде: Steven K. Dallas et al., “Don’t Count Calorie Labeling Out: Calorie Counts on the Left Side of Menu Items Lead to Lower Calorie Food Choices,” Journal of Consumer Psychology 29, no. 1 (2019): 60–69.
14-ТАРАУ
бір қарқындылық шкаласын екіншісіне проекциялау: S. S. Stevens, “On the Operation Known as Judgment,” American Scientist 54, no. 4 (желтоқсан 1966): 385–401. Біздің сәйкестендіру (matching) терминін қолдануымыз Стивенске қарағанда кеңірек, ол бұл терминді тек қатынастар шкалаларымен шектеген болатын (біз оған 15-тарауда ораламыз).
жүйелі пайымдау қателігі: Мысал алғаш рет Daniel Kahneman, Thinking, Fast and Slow (New York: Farrar, Straus and Giroux, 2011) кітабында енгізілген.
дәл сол сандар: Daniel Kahneman and Amos Tversky, “On the Psychology of Prediction,” Psychological Review 80 (1973): 237–251.
«Ғажайып жеті саны»: G. A. Miller, “The Magical Number Seven, Plus or Minus Two: Some Limits on Our Capacity for Processing Information,” Psychological Review (1956): 63–97.
салыстыруға мәжбүрлейтін шкалалар: R. D. Goffin and J. M. Olson, “Is It All Relative? Comparative Judgments and the Possible Improvement of Self-Ratings and Ratings of Others,” Perspectives on Psychological Science 6 (2011): 48–60.
15-ТАРАУ
1998 жылы хабарланды: Daniel Kahneman, David Schkade, and Cass Sunstein, “Shared Outrage and Erratic Awards: The Psychology of Punitive Damages,” Journal of Risk and Uncertainty 16 (1998): 49–86, https://link.springer.com/article/10.1023/A:1007710408413; және Cass Sunstein, Daniel Kahneman, and David Schkade, “Assessing Punitive Damages (with Notes on Cognition and Valuation in Law),” Yale Law Journal 107, no. 7 (мамыр 1998): 2071–2153. Зерттеу шығындарын Exxon компаниясы біржолғы келісім бойынша өтеді, бірақ компания зерттеушілерге ақы төлеген жоқ, деректерді бақыламады және академиялық журналдарда жарияланғанға дейін нәтижелер туралы алдын ала білмеді.
«негізді күмән»: A. Keane and P. McKeown, The Modern Law of Evidence (New York: Oxford University Press, 2014).
«болуы екіталай»: Andrew Mauboussin and Michael J. Mauboussin, “If You Say Something Is ‘Likely,’ How Likely Do People Think It Is?,” Harvard Business Review, 3 шілде, 2018 жыл.
жаңа BMW: BMW v. Gore, 517 U.S. 559 (1996), https://supreme.justia.com/cases/federal/us/517/559.
ыза-кек эмоциясы: Моральдық пайымдаулардағы эмоцияның рөлін талқылау үшін қараңыз: J. Haidt, “The Emotional Dog and Its Rational Tail: A Social Intuitionist Approach to Moral Judgment,” Psychological Review 108, no. 4 (2001): 814–834; Joshua Greene, Moral Tribes: Emotion, Reason, and the Gap Between Us and Them (New York: Penguin Press, 2014). Ыза-кек — әділетсіздікке қарсы туған қатты эмоционалды реакция.
13-сурет нәтижелерді көрсетеді: Осы бағалаулардағы шудың көптігін ескерсек, ыза-кек пен жазалау ниеті пайымдаулары арасындағы өте жоғары корреляция (.98) сізді таңғалдыруы мүмкін. Корреляция пайымдаулардың орташа мәндері арасында есептелгенін есіңізге түсіргенде, бұл жұмбақ жоғалады. 100 пайымдаудың орташа мәні үшін шу (пайымдаулардың стандартты ауытқуы) 10 есе азаяды. Көптеген пайымдаулар біріктірілгенде (агрегацияланғанда), шу фактор болудан қалады. 21-тарауды қараңыз.
қарқындылық қатынастары: S. S. Stevens, Psychophysics: Introduction to Its Perceptual, Neural and Social Prospects (New York: John Wiley & Sons, 1975).
«жүйелі еріктілік»: Dan Ariely, George Loewenstein, and Drazen Prelec, “‘Coherent Arbitrariness’: Stable Demand Curves Without Stable Preferences,” Quarterly Journal of Economics 118, no. 1 (2003): 73–106.
Долларлық өтемақыларды рейтингтерге айналдыру: Рейтингтерге айналдыру ақпараттың жоғалуына әкеледі, өйткені пайымдаулар арасындағы қашықтық сақталмайды. Айталық, бар болғаны үш жағдай бар және бір алқаби 10 миллион, 2 миллион және 1 миллион доллар көлемінде өтемақы ұсынады. Әлбетте, алқаби алғашқы екі жағдайдың арасындағы жазалау ниетінің айырмашылығын екінші мен үшінші жағдайдың арасындағыдан көбірек көрсеткісі келеді. Алайда, дәрежелерге (рангтерге) айналдырғаннан кейін айырмашылық бірдей болады — тек бір дәрежелік айырмашылық. Бұл мәселені пайымдауларды стандартты ұпайларға айналдыру арқылы шешуге болады.
16-ТАРАУ
қабылдау процесі: R. Blake and N. K. Logothetis, “Visual competition,” Nature Reviews Neuroscience 3 (2002) 13–21; M. A. Gernsbacher and M. E. Faust, “The Mechanism of Suppression: A Component of General Comprehension Skill,” Journal of Experimental Psychology: Learning, Memory, and Cognition 17 (наурыз 1991): 245–262; және M. C. Stites and K. D. Federmeier, “Subsequent to Suppression: Downstream Comprehension Consequences of Noun/Verb Ambiguity in Natural Reading,” Journal of Experimental Psychology: Learning, Memory, and Cognition 41 (қыркүйек 2015): 1497–1515.
тиісті деңгейден көбірек сенімді: D. A. Moore and D. Schatz, “The three faces of overconfidence,” Social and Personality Psychology Compass 11, no. 8 (2017), article e12331.
Корпоративтік беделді зерттеу: S. Highhouse, A. Broadfoot, J. E. Yugo, and S. A. Devendorf, “Examining Corporate Reputation Judgments with Generalizability Theory,” Journal of Applied Psychology 94 (2009): 782–789. Скотт Хайхаус пен Элисон Бродфутқа түпнұсқа деректерді бергені үшін, ал Джулиан Парриске қосымша талдаулары үшін алғыс айтамыз.
командалар құру: P. J. Lamberson and Scott Page, “Optimal forecasting groups,” Management Science 58, no. 4 (2012): 805–10. Скотт Пейджге заңдылық шуының (pattern noise) осы көзіне назарымызды аударғаны үшін алғыс айтамыз.
сканерлеудің алғашқы әрекеті: Оллпорт пен Одберттің (1936) ағылшын тіліндегі тұлғаға қатысты сөздік қоры туралы жұмысы мына жерде келтірілген: Oliver P. John and Sanjay Srivastava, “The Big-Five Trait Taxonomy: History, Measurement, and Theoretical Perspectives,” Handbook of Personality: Theory and Research, 2nd ed., ed. L. Pervin and Oliver P. John (New York: Guilford, 1999).
жоғары деп саналады: Ian W. Eisenberg, Patrick G. Bissett, A. Zeynep Enkavi et al., “Uncovering the structure of self-regulation through data-driven ontology discovery,” Nature Communications 10 (2019): 2319.
физикалық қауіп төнгенде: Walter Mischel, “Toward an integrative science of the person,” Annual Review of Psychology 55 (2004): 1–22.
17-ТАРАУ
MSE -нің қалай жіктелетіні: Ауытқу (bias) мен шудың жіктелуі туралы жалпы ереже болмағанымен, бұл суреттегі пропорциялар біз қарастырған кейбір шынайы немесе ойдан шығарылған мысалдарға шамамен сәйкес келеді. Нақтырақ айтсақ, бұл суретте ауытқу мен шу тең (GoodSell сату болжамдарындағыдай). Деңгейлік шудың квадраты жүйелік шу квадратының 37%-ын құрайды (жазалау өтемақылары туралы зерттеудегідей). Көрсетілгендей, кездейсоқ шудың квадраты заңдылық шуы квадратының шамамен 35%-ын құрайды. MSE (Mean Squared Error) — орташа квадраттық қателік.
патенттік кеңселер: Кіріспедегі сілтемелерді қараңыз. Mark A. Lemley and Bhaven Sampat, “Examiner Characteristics and Patent Office Outcomes,” Review of Economics and Statistics 94, no. 3 (2012): 817–827. Сондай-ақ мынаны қараңыз: Iain Cockburn, Samuel Kortum, and Scott Stern, “Are All Patent Examiners Equal? The Impact of Examiner Characteristics,” working paper 8980, маусым 2002, www.nber.org/papers/w8980; және Michael D. Frakes and Melissa F. Wasserman, “Is the Time Allocated to Review Patent Applications Inducing Examiners to Grant Invalid Patents? Evidence from Microlevel Application Data,” Review of Economics and Statistics 99, no. 3 (шілде 2017): 550–563.
баланы қорғау қызметтері: Joseph J. Doyle Jr., “Child Protection and Child Outcomes: Measuring the Effects of Foster Care,” American Economic Review 95, no. 5 (желтоқсан 2007): 1583–1610.
баспана мәселесі бойынша судьялар: Andrew I. Schoenholtz, Jaya Ramji-Nogales, and Philip G. Schrag, “Refugee Roulette: Disparities in Asylum Adjudication,” Stanford Law Review 60, no. 2 (2007).
шамамен 2,8 жыл: Бұл мән 6-тарауда келтірілген есептеулерден алынған, онда өзара әрекеттесу дисперсиясы жалпы дисперсияның 23%-ын құрайды. Үкімдер қалыпты таралған деген болжаммен, кездейсоқ таңдалған екі бақылаудың арасындағы орташа абсолюттік айырмашылық 1,128 SD құрайды.
Принстондағы зерттеушілер тобы: J. E. Martinez, B. Labbree, S. Uddenberg, and A. Todorov, “Meaningful ‘noise’: Comparative judgments contain stable idiosyncratic contributions” (жарияланбаған қолжазба).
кепілмен босату судьяларын зерттеу: J. Kleinberg, H. Lakkaraju, J. Leskovec, J. Ludwig, and S. Mullainathan, “Human Decisions and Machine Predictions,” Quarterly Journal of Economics 133 (2018): 237–293.
симуляцияланған судьяларды қолдану: Модель әрбір судья үшін 141 833 істің реттілігін және кепілдік берілетін шекті мәнді (threshold) шығарды. Деңгейлік шу шекті мәндердің өзгергіштігін көрсетсе, заңдылық шуы істердің реттілігіндегі өзгергіштікті көрсетеді.
тұрақты заңдылық шуы: Gregory Stoddard, Jens Ludwig, and Sendhil Mullainathan, авторлармен электрондық пошта арқылы хат алмасу, маусым–шілде 2020 жыл.
Фил Розенцвейг сенімді түрде дәлелдеді: Phil Rosenzweig. Left Brain, Right Stuff: How Leaders Make Winning Decisions (New York: PublicAffairs, 2014).
18-ТАРАУ
18-ТАРАУ
- топ қабілетті адамдардан құралады: Albert E. Mannes et al. , “The Wisdom of Select Crowds,” Journal of Personality and Social Psychology 107, no. 2 (2014): 276–299; Jason Dana et al. , “The Composition of Optimally Wise Crowds,” Decision Analysis 12, no. 3 (2015): 130–143.
- сенімділік эвристикасы (адамның өз біліміне деген сенімділігін ақпараттың дәлдігінің көрсеткіші ретінде қабылдауы): Briony D. Pulford, Andrew M. Colmna, Eike K. Buabang, and Eva M. Krockow, “The Persuasive Power of Knowledge: Testing the Confidence Heuristic,” Journal of Experimental Psychology: General 147, no. 10 (2018): 1431–1444.
- ол тек мынаған ғана байланысты емес: Nathan R. Kuncel and Sarah A. Hezlett, “Fact and Fiction in Cognitive Ability Testing for Admissions and Hiring Decisions,” Current Directions in Psychological Science 19, no. 6 (2010): 339–345.
- сақталып қалған қате түсініктер: Kuncel and Hezlett, “Fact and Fiction. ”
- Бір шолуда айтылғандай: Frank L. Schmidt and John Hunter, “General Mental Ability in the World of Work: Occupational Attainment and Job Performance,” Journal of Personality and Social Psychology 86, no. 1 (2004): 162.
- ұқыптылық пен табандылық (ұзақ мерзімді мақсаттарға жетудегі қажырлылық): Angela L. Duckworth, David Weir, Eli Tsukayama, and David Kwok, “Who Does Well in Life? Conscientious Adults Excel in Both Objective and Subjective Success,” Frontiers in Psychology 3 (September 2012). Табандылық (grit) бойынша қараңыз: Angela L. Duckworth, Christopher Peterson, Michael D. Matthews, and Dennis Kelly, “Grit: Perseverance and Passion for Long-Term Goals,” Journal of Personality and Social Psychology 92, no. 6 (2007): 1087–1101.
- сұйық интеллект (бұрын кездеспеген жаңа мәселелерді шешу және логикалық ойлау қабілеті): Richard E. Nisbett et al. , “Intelligence: New Findings and Theoretical Developments,” American Psychologist 67, no. 2 (2012): 130–159.
- «көпшіліктен үлкенірек»: Schmidt and Hunter, “Occupational Attainment,” 162.
- . 50 диапазонында: Kuncel and Hezlett, “Fact and Fiction. ”
- әлеуметтік ғылым стандарттары бойынша: Бұл корреляциялар критерийдегі өлшеу қателігін және диапазон шектеуін түзететін мета-анализдерден алынған. Зерттеушілер арасында бұл түзетулер Жалпы Ақыл-ой Қабілетінің (GMA) болжамдық мәнін асыра көрсете ме деген пікірталас бар. Дегенмен, бұл әдістемелік пікірталастар басқа болжау көрсеткіштеріне де қатысты болғандықтан, сарапшылар әдетте GMA (жұмыс үлгісі сынақтарымен бірге; 24-тарауды қараңыз) жұмыстағы табыстың ең жақсы болжаушысы екендігімен келіседі. Қараңыз: Kuncel and Hezlett, “Fact and Fiction. ”
- GMA көрсеткіші орташадан төмен адамдар дерлік жоқ: Schmidt and Hunter, “Occupational Attainment,” 162.
- Тіпті үздік 1% арасында да: David Lubinski, “Exceptional Cognitive Ability: The Phenotype,” Behavior Genetics 39, no. 4 (2009): 350–358.
- 2013 жылғы Fortune 500 компанияларының бас директорларына бағытталған зерттеу: Jonathan Wai, “Investigating America’s Elite: Cognitive Ability, Education, and Sex Differences,” Intelligence 41, no. 4 (2013): 203–211.
- Ұсынылған басқа сұрақтар: Keela S. Thomson and Daniel M. Oppenheimer, “Investigating an Alternate Form of the Cognitive Reflection Test,” Judgment and Decision Making 11, no. 1 (2016): 99–113.
- Төменірек CRT (Когнитивті Рефлексия Тесті) ұпайлары мыналармен байланысты: Gordon Pennycook et al. , “Everyday Consequences of Analytic Thinking,” Current Directions in Psychological Science 24, no. 6 (2015): 425–432.
- анық қате «жалған жаңалықтарға» алданып қалу: Gordon Pennycook and David G. Rand, “Lazy, Not Biased: Susceptibility to Partisan Fake News Is Better Explained by Lack of Reasoning than by Motivated Reasoning,” Cognition 188 (June 2018): 39–50.
- адамдардың смартфондарын қаншалықты қолданатыны: Nathaniel Barr et al. , “The Brain in Your Pocket: Evidence That Smartphones Are Used to Supplant Thinking,” Computers in Human Behavior 48 (2015): 473–480.
- рефлексивті ойлауды пайдалануға бейімділік: Niraj Patel, S. Glenn Baker, and Laura D. Scherer, “Evaluating the Cognitive Reflection Test as a Measure of Intuition/Reflection, Numeracy, and Insight Problem Solving, and the Implications for Understanding Real-World Judgments and Beliefs,” Journal of Experimental Psychology: General 148, no. 12 (2019): 2129–2153.
- танымға қажеттілік шкаласы (адамның күрделі ойлау процестерінен ләззат алу деңгейін өлшеу): John T. Cacioppo and Richard E. Petty, “The Need for Cognition,” Journal of Personality and Social Psychology 42, no. 1 (1982): 116–131.
- белгілі когнитивті қисуларға азырақ бейім: Stephen M. Smith and Irwin P. Levin, “Need for Cognition and Choice Framing Effects,” Journal of Behavioral Decision Making 9, no. 4 (1996): 283–290.
- спойлер туралы ескерту: Judith E. Rosenbaum and Benjamin K. Johnson, “Who’s Afraid of Spoilers? Need for Cognition, Need for Affect, and Narrative Selection and Enjoyment,” Psychology of Popular Media Culture 5, no. 3 (2016): 273–289.
- Ересектердің шешім қабылдау құзыреттілігі шкаласы: Wandi Bruine De Bruin et al. , “Individual Differences in Adult Decision-Making Competence,” Journal of Personality and Social Psychology 92, no. 5 (2007): 938–956.
- Халперннің сыни ойлауы: Heather A. Butler, “Halpern Critical Thinking Assessment Predicts Real-World Outcomes of Critical Thinking,” Applied Cognitive Psychology 26, no. 5 (2012): 721–729.
- болжау қабілетін алдын ала анықтауы мүмкін: Uriel Haran, Ilana Ritov, and Barbara Mellers, “The Role of Actively Open-Minded Thinking in Information Acquisition, Accuracy, and Calibration,” Judgment and Decision Making 8, no. 3 (2013): 188–201.
- «белсенді ашық ойлау»: Haran, Ritov, and Mellers, “Role of Actively Open-Minded Thinking. ”
- үйретуге болатын дағды: J. Baron, “Why Teach Thinking? An Essay,” Applied Psychology: An International Review 42 (1993): 191–214; J. Baron, The Teaching of Thinking: Thinking and Deciding, 2nd ed. (New York: Cambridge University Press, 1994), 127–148.
19-ТАРАУ
- олардың негізгі тұжырымдары: Керемет шолу үшін қараңыз: Jack B. Soll et al. , “A User’s Guide to Debiasing,” in The Wiley Blackwell Handbook of Judgment and Decision Making, ed. Gideon Keren and George Wu, vol. 2 (New York: John Wiley & Sons, 2015), 684.
- Жасыл кітап (The Green Book): HM Treasury, The Green Book: Central Government Guidance on Appraisal and Evaluation (London: UK Crown, 2018), https://assets. publishing. service. gov. uk/government/uploads/system/uploads/attachment_data/file/685903/The_Green_Book. pdf.
- түрткілер (nudges — адамдарды белгілі бір шешімге мәжбүрлемей, олардың таңдауына жанама әсер ету тәсілдері): Richard H. Thaler and Cass R. Sunstein, Nudge: Improving Decisions about Health, Wealth, and Happiness (New Haven, CT: Yale University Press, 2008).
- күшейту (boosting — адамның шешім қабылдау дағдыларын білім мен құралдар арқылы тікелей арттыру): Ralph Hertwig and Till Grüne-Yanoff, “Nudging and Boosting: Steering or Empowering Good Decisions,” Perspectives on Psychological Science 12, no. 6 (2017).
- білім пайдалы: Geoffrey T. Fong et al. , “The Effects of Statistical Training on Thinking About Everyday Problems,” Cognitive Psychology 18, no. 3 (1986): 253–292.
- дәл сондай асыра сенімді: Willem A. Wagenaar and Gideon B. Keren, “Does the Expert Know? The Reliability of Predictions and Confidence Ratings of Experts,” Intelligent Decision Support in Process Environments (1986): 87–103.
- қателер санын азайтты: Carey K. Morewedge et al. , “Debiasing Decisions: Improved Decision Making with a Single Training Intervention,” Policy Insights from the Behavioral and Brain Sciences 2, no. 1 (2015): 129–140.
- бұл үйренгенін іс жүзінде қолданды: Anne-Laure Sellier et al. , “Debiasing Training Transfers to Improve Decision Making in the Field,” Psychological Science 30, no. 9 (2019): 1371–1379.
- қисудың соқыр нүктесі (адамның өз бойындағы қателіктерді байқамай, өзгелерден жылдам көруі): Emily Pronin et al. , “The Bias Blind Spot: Perceptions of Bias in Self Versus Others,” Personality and Social Psychology Bulletin 28, no. 3 (2002): 369–381.
- әсер еткен болуы мүмкін қисулар: Daniel Kahneman, Dan Lovallo, and Olivier Sibony, “Before You Make That Big Decision… ,” Harvard Business Review 89, no. 6 (June 2011): 50–60.
- тексеру парақтарының ұзақ тарихы бар: Atul Gawande, Checklist Manifesto: How to Get Things Right (New York: Metropolitan Books, 2010).
- қарапайым тексеру парағы: Office of Information and Regulatory Affairs, “Agency Checklist: Regulatory Impact Analysis,” no date, www. whitehouse. gov/sites/whitehouse. gov/files/omb/inforeg/inforeg/regpol/RIA_Checklist. pdf.
- біз мынаны қостық: Бұл тексеру парағы ішінара Daniel Kahneman et al. , “Before You Make That Big Decision,” Harvard Business Review мақаласынан бейімделген.
- оны енгізуді жеңілдету: Қараңыз: Gawande, Checklist Manifesto.
20-ТАРАУ
- «адам қателігі»: R. Stacey, “A Report on the Erroneous Fingerprint Individualisation in the Madrid Train Bombing Case,” Journal of Forensic Identification 54 (2004): 707–718.
- ФБР веб-сайты: Michael Specter, “Do Fingerprints Lie? ,” The New Yorker, May 27, 2002. Эксклюзивті екпін қосылған.
- Дрор айтқандай: I. E. Dror and R. Rosenthal, “Meta-analytically Quantifying the Reliability and Biasability of Forensic Experts,” Journal of Forensic Science 53 (2008): 900–903.
- Бірінші зерттеуде: I. E. Dror, D. Charlton, and A. E. Péron, “Contextual Information Renders Experts Vulnerable to Making Erroneous Identifications,” Forensic Science International 156 (2006): 74–78.
- Екінші зерттеуде: I. E. Dror amd D. Charlton, “Why Experts Make Errors,” Journal of Forensic Identification 56 (2006): 600–616.
- «сарапшы-дактилоскопистер»: I. E. Dror and S. A. Cole, “The Vision in ‘Blind’ Justice: Expert Perception, Judgment, and Visual Cognition in Forensic Pattern Recognition,” Psychonomic Bulletin and Review 17 (2010): 161–167, 165. Сондай-ақ қараңыз: I. E. Dror, “A Hierarchy of Expert Performance (HEP),” Journal of Applied Research in Memory and Cognition (2016): 1–6.
- Бөлек зерттеуде: I. E. Dror et al. , “Cognitive Issues in Fingerprint Analysis: Inter- and Intra-Expert Consistency and the Effect of a ‘Target’ Comparison,” Forensic Science International 208 (2011): 10–17.
- Кейінгі тәуелсіз зерттеу: B. T. Ulery, R. A. Hicklin, M. A. Roberts, and J. A. Buscaglia, “Changes in Latent Fingerprint Examiners’ Markup Between Analysis and Comparison,” Forensic Science International 247 (2015): 54–61.
- Тіпті ДНҚ анализі де: I. E. Dror and G. Hampikian, “Subjectivity and Bias in Forensic DNA Mixture Interpretation,” Science and Justice 51 (2011): 204–208.
- Сарапшылар жиі мынаны алады: M. J. Saks, D. M. Risinger, R. Rosenthal, and W. C. Thompson, “Context Effects in Forensic Science: A Review and Application of the Science of Science to Crime Laboratory Practice in the United States,” Science Justice Journal of Forensic Science Society 43 (2003): 77–90.
- тексеруші сарапшы біледі: President’s Council of Advisors on Science and Technology (PCAST), Report to the President: Forensic Science in Criminal Courts: Ensuring Scientific Validity of Feature-Comparison Methods (Washington, DC: Executive Office of the President, PCAST, 2016).
- қателікті кейіннен зерттеу: Stacey, “Erroneous Fingerprint. ”
- жоғары құрметке ие тәуелсіз сарапшы: Dror and Cole, “Vision in ‘Blind’ Justice. ”
- қису каскадтары (бір сарапшының қате пікірінің келесі сарапшыларға тізбекті түрде әсер етуі): I. E. Dror, “Biases in Forensic Experts,” Science 360 (2018): 243.
- кейде өз ойларын өзгертеді: Dror and Charlton, “Why Experts Make Errors. ”
- 2012 жылғы зерттеу: B. T. Ulery, R. A. Hicklin, J. A. Buscaglia, and M. A. Roberts, “Repeatability and Reproducibility of Decisions by Latent Fingerprint Examiners,” PLoS One 7 (2012).
- «Кінәсіздік» жобасы: Innocence Project, “Overturning Wrongful Convictions Involving Misapplied Forensics,” Misapplication of Forensic Science (2018): 1–7, www. innocenceproject. org/causes/misapplication-forensic-science. Сондай-ақ қараңыз: S. M. Kassin, I. E. Dror, J. Kukucka, and L. Butt, “The Forensic Confirmation Bias: Problems, Perspectives, and Proposed Solutions,” Journal of Applied Research in Memory and Cognition 2 (2013): 42–52.
- тереңдетілген шолу: PCAST, Report to the President.
- саусақ іздерін ауқымды зерттеу: B. T. Ulery, R. A. Hicklin, J. Buscaglia, and M. A. Roberts, “Accuracy and Reliability of Forensic Latent Fingerprint Decisions,” Proceedings of the National Academy of Sciences 108 (2011): 7733–7738.
- «әлдеқайда жоғары»: (PCAST), Report to the President, p. 95. Түпнұсқада ерекшеленген.
- Флоридада жүргізілген келесі зерттеу: Igor Pacheco, Brian Cerchiai, and Stephanie Stoiloff, “Miami-Dade Research Study for the Reliability of the ACE-V Process: Accuracy & Precision in Latent Fingerprint Examinations,” final report, Miami-Dade Police Department Forensic Services Bureau, 2014, www. ncjrs. gov/pdffiles1/nij/grants/248534. pdf.
- «көптеген істерде»: B. T. Ulery, R. A. Hicklin, M. A. Roberts, and J. A. Buscaglia, “Factors Associated with Latent Fingerprint Exclusion Determinations,” Forensic Science International 275 (2017): 65–75.
- жалған-оң сәйкестендірулер әлдеқайда аз: R. N. Haber and I. Haber, “Experimental Results of Fingerprint Comparison Validity and Reliability: A Review and Critical Analysis,” Science & Justice 54 (2014): 375–389.
- «Сыртқы әсерге жығылу оңайырақ»: Dror, “Hierarchy of Expert Performance,” 3.
- «Диснейлендтен жұмыс іздеңіз»: M. Leadbetter, letter to the editor, Fingerprint World 33 (2007): 231.
- «өз пікірлерін нақты өзгертпестен»: L. Butt, “The Forensic Confirmation Bias: Problems, Perspectives and Proposed Solutions—Commentary by a Forensic Examiner,” Journal of Applied Research in Memory and Cognition 2 (2013): 59–60. Ерекше екпін қосылған.
- Тіпті ФБР де: Stacey, “Erroneous Fingerprint,” 713. Ерекше екпін қосылған.
- Төрт жүз адам қатысқан сауалнамада: J. Kukucka, S. M. Kassin, P. A. Zapf, and I. E. Dror, “Cognitive Bias and Blindness: A Global Survey of Forensic Science Examiners,” Journal of Applied Research in Memory and Cognition 6 (2017).
- сызықтық жүйелі ашу (сарапшыға қажетсіз ақпаратты біртіндеп жабу арқылы бейтараптықты сақтау әдісі): I. E. Dror et al. , letter to the editor: “Context Management Toolbox: A Linear Sequential Unmasking (LSU) Approach for Minimizing Cognitive Bias in Forensic Decision Making,” Journal of Forensic Science 60 (2015): 1111–1112.
21-ТАРАУ
- ресми агенттіктер: Jeffrey A. Frankel, “Over-optimism in Forecasts by Official Budget Agencies and Its Implications,” working paper 17239, National Bureau of Economic Research, December 2011, www. nber. org/papers/w17239.
- тым сенімді болуға бейім: H. R. Arkes, “Overconfidence in Judgmental Forecasting,” in Principles of Forecasting: A Handbook for Researchers and Practitioners, ed. Jon Scott Armstrong, vol. 30, International Series in Operations Research & Management Science (Boston: Springer, 2001).
- жүргізіліп жатқан тоқсандық сауалнама: Itzhak Ben-David, John Graham, and Campell Harvey, “Managerial Miscalibration,” The Quarterly Journal of Economics 128, no. 4 (November 2013): 1547–1584.
- «сенімсіздік — қайнар көз»: T. R. Stewart, “Improving Reliability of Judgmental Forecasts,” in Principles of Forecasting: A Handbook for Researchers and Practitioners, ed. Jon Scott Armstrong, vol. 30, International Series in Operations Research & Management Science (Boston: Springer, 2001) (бұдан әрі Principles of Forecasting деп аталады), 82.
- Жоғарғы Сот шешімдерін болжау: Theodore W. Ruger, Pauline T. Kim, Andrew D. Martin, and Kevin M. Quinn, “The Supreme Court Forecasting Project: Legal and Political Science Approaches to Predicting Supreme Court Decision-Making,” Columbia Law Review 104 (2004): 1150–1209.
- ауаның ластануын реттеу: Cass Sunstein, “Maximin,” Yale Journal of Regulation (жоба; 3 мамыр, 2020), https://papers. ssrn. com/sol3/papers. cfm? abstract_id=3476250.
- көптеген мысалдар: Көптеген мысалдар үшін қараңыз: Armstrong, Principles of Forecasting.
- бірнеше болжамды орташалау: Jon Scott Armstrong, “Combining Forecasts,” in Principles of Forecasting, 417–439.
- көпшіліктен асып түседі: T. R. Stewart, “Improving Reliability of Judgmental Forecasts,” in Principles of Forecasting, 95.
- орташа есеппен 12. 5%: Armstrong, “Combining Forecasts. ”
- таңдаулы топ (select-crowd): Albert E. Mannes et al. , “The Wisdom of Select Crowds,” Journal of Personality and Social Psychology 107, no. 2 (2014): 276–299.
- болжау нарықтары өте жақсы жұмыс істейтіні анықталды: Justin Wolfers and Eric Zitzewitz, “Prediction Markets,” Journal of Economic Perspectives 18 (2004): 107–126.
- болжау нарықтарын пайдаланды: Cass R. Sunstein and Reid Hastie, Wiser: Getting Beyond Groupthink to Make Groups Smarter (Boston: Harvard Business Review Press, 2014).
- Дельфи әдісі (сарапшылар тобының пікірін құпия түрде жинап, бірнеше кезеңде ортақ тұжырымға келу тәсілі): Gene Rowe and George Wright, “The Delphi Technique as a Forecasting Tool: Issues and Analysis,” International Journal of Forecasting 15 (1999): 353–375. Сондай-ақ қараңыз: Dan Bang and Chris D. Frith, “Making Better Decisions in Groups,” Royal Society Open Science 4, no. 8 (2017).
- енгізу қиын: R. Hastie, “Review Essay: Experimental Evidence on Group Accuracy,” in B. Grofman and G. Guillermo, eds. , Information Pooling and Group Decision Making (Greenwich, CT: JAI Press, 1986), 129–157.
- шағын-Дельфи: Andrew H. Van De Ven and André L. Delbecq, “The Effectiveness of Nominal, Delphi, and Interacting Group Decision Making Processes,” Academy of Management Journal 17, no. 4 (2017).
- «орташадан жақсырақ»: Superforecasting, 95.
- «ең күшті болжаушы»: Superforecasting, 231.
- «көріңіз, сәтсіздікке ұшыраңыз, талдаңыз»: Superforecasting, 273.
- күрделі статистикалық әдіс: Ville A. Satopää, Marat Salikhov, Philip E. Tetlock, and Barb Mellers, “Bias, Information, Noise: The BIN Model of Forecasting,” February 19, 2020, 23, https://dx. doi. org/10. 2139/ssrn. 3540864.
- «Кез келген араласу кезінде»: Satopää et al. , “Bias, Information, Noise,” 23.
- «Команда құру — оқытудан өзгеше»: Satopää et al. , 22.
- «"Суперболжаушылар" мынаған қарыздар болуы мүмкін»: Satopää et al. , 24.
- тәуелсіз де, бірін-бірі толықтырушы да: Clintin P. Davis-Stober, David V. Budescu, Stephen B. Broomell, and Jason Dana. “The composition of optimally wise crowds. ” Decision Analysis 12, no. 3 (2015): 130–143.
22-ТАРАУ
- Сіңір дегенерациясын сандық бағалау мынаны береді: Laura Horton et al. , “Development and Assessment of Inter- and Intra-Rater Reliability of a Novel Ultrasound Tool for Scoring Tendon and Sheath Disease: A Pilot Study,” Ultrasound 24, no. 3 (2016): 134, www. ncbi. nlm. nih. gov/pmc/articles/PMC5105362.
- Патологтар биопсияны бағалағанда: Laura C. Collins et al. , “Diagnostic Agreement in the Evaluation of Image-guided Breast Core Needle Biopsies,” American Journal of Surgical Pathology 28 (2004): 126, https://journals. lww. com/ajsp/Abstract/2004/01000/Diagnostic_Agreement_in_the_Evaluation_of. 15. aspx.
- Жедел антиген нәтижесі болмаса: Julie L. Fierro et al. , “Variability in the Diagnosis and Treatment of Group A Streptococcal Pharyngitis by Primary Care Pediatricians,” Infection Control and Hospital Epidemiology 35, no. S3 (2014): S79, www. jstor. org/stable/10. 1086/677820.
- сізде диабет бар деп есептеледі: Diabetes Tests, Centers for Disease Control and Prevention, https://www. cdc. gov/diabetes/basics/getting-tested. html (соңғы рет 15 қаңтар, 2020 жылы қаралған).
- Кейбір ауруханаларда екінші: Joseph D. Kronz et al. , “Mandatory Second Opinion Surgical Pathology at a Large Referral Hospital,” Cancer 86 (1999): 2426, https://onlinelibrary. wiley. com/doi/full/10. 1002/(SICI)1097-0142(19991201)86:11%3C2426::AID-CNCR34%3E3. 0. CO;2-3.
- Dartmouth Atlas жобасы мынаған арналған: Материалдардың көпшілігін желіден табуға болады; кітап көлеміндегі шолу: Dartmouth Medical School, The Quality of Medical Care in the United States: A Report on the Medicare Program; the Dartmouth Atlas of Health Care 1999 (American Hospital Publishers, 1999).
- Осындай қорытындылар келесіде де сақталады: See, for example, OECD, Geographic Variations in Health Care: What Do We Know and What Can Be Done to Improve Health System Performance? (Paris: OECD Publishing, 2014), 137–169; Michael P. Hurley et al. , “Geographic Variation in Surgical Outcomes and Cost Between the United States and Japan,” American Journal of Managed Care 22 (2016): 600, www. ajmc. com/journals/issue/2016/2016-vol22-n9/geographic-variation-in-surgical-outcomes-and-cost-between-the-united-states-and-japan; and John Appleby, Veena Raleigh, Francesca Frosini, Gwyn Bevan, Haiyan Gao, and Tom Lyscom, Variations in Health Care: The Good, the Bad and the Inexplicable (London: The King’s Fund, 2011), www. kingsfund. org. uk/sites/default/files/Variations-in-health-care-good-bad-inexplicable-report-The-Kings-Fund-April-2011. pdf.
- Пневмония диагноздарын зерттеу: David C. Chan Jr. et al. , “Selection with Variation in Diagnostic Skill: Evidence from Radiologists,” National Bureau of Economic Research, NBER Working Paper No. 26467, November 2019, www. nber. org/papers/w26467.
- Басқа жерлердегідей, мұнда да оқыту: P. J. Robinson, “Radiology’s Achilles’ Heel: Error and Variation in the Interpretation of the Röntgen Image,” British Journal of Radiology 70 (1997): 1085, www. ncbi. nlm. nih. gov/pubmed/9536897. Тиісті зерттеу: Yusuke Tsugawa et al. , “Physician Age and Outcomes in Elderly Patients in Hospital in the US: Observational Study,” BMJ 357 (2017), www. bmj. com/content/357/bmj. j1797. Онда дәрігерлердің оқу бітірген уақыты ұзарған сайын емдеу нәтижелерінің нашарлайтыны анықталған. Бұдан шығатыны, көпжылдық тәжірибе жинақтау мен ең соңғы дәлелдер мен нұсқаулықтармен таныс болу арасында тепе-теңдік бар. Зерттеу барысында ең жақсы нәтижелерді резидентураны (резидентура — жоғары оқу орнынан кейінгі тереңдетілген медициналық дайындық) бітіргеніне бірнеше жыл ғана болған, әрі жаңағы дәлелдер әлі есінде бар дәрігерлер көрсететіні анықталды.
- Рентгенологтар, мысалы, былай атайды: Robinson, “Radiology’s Achilles’ Heel. ”
- каппа статистикасы: Корреляция коэффициенті (корреляция коэффициенті — екі айнымалы арасындағы байланыстың күшін көрсететін көрсеткіш) секілді каппа да теріс болуы мүмкін, бірақ бұл іс жүзінде сирек кездеседі. Түрлі каппа статистикасының мағынасына бір сипаттама: «төмен (κ = 0. 00-ден 0. 20-ға дейін), қанағаттанарлық (κ = 0. 21-ден 0. 40-ға дейін), орташа (κ = 0. 41-ден 0. 60-ға дейін), айтарлықтай (κ = 0. 61-ден 0. 80-ға дейін) және мінсіз дерлік (κ > 0. 80)» (Ron Wald, Chaim M. Bell, Rosane Nisenbaum, Samuel Perrone, Orfeas Liangos, Andreas Laupacis, and Bertrand L. Jaber, “Interobserver Reliability of Urine Sediment Interpretation,” Clinical Journal of the American Society of Nephrology 4, no. 3 [March 2009]: 567–571, https://cjasn. asnjournals. org/content/4/3/567).
- дәрілік заттардың өзара әрекеттесуі: Howard R. Strasberg et al. , “Inter-Rater Agreement Among Physicians on the Clinical Significance of Drug-Drug Interactions,” AMIA Annual Symposium Proceedings (2013): 1325, www. ncbi. nlm. nih. gov/pmc/articles/PMC3900147.
- Бірақ нефрологтар тек мынаны көрсетеді: Wald et al. , “Interobserver Reliability of Urine Sediment Interpretation,” https://cjasn. asnjournals. org/content/4/3/567.
- сүт безінің зақымдануы ма: Juan P. Palazzo et al. , “Hyperplastic Ductal and Lobular Lesions and Carcinomas in Situ of the Breast: Reproducibility of Current Diagnostic Criteria Among Community- and Academic-Based Pathologists,” Breast Journal 4 (2003): 230, www. ncbi. nlm. nih. gov/pubmed/21223441.
- сүт безінің пролиферативті зақымданулары: Rohit K. Jain et al. , “Atypical Ductal Hyperplasia: Interobserver and Intraobserver Variability,” Modern Pathology 24 (2011): 917, www. nature. com/articles/modpathol201166.
- омыртқа стенозының дәрежесі: Alex C. Speciale et al. , “Observer Variability in Assessing Lumbar Spinal Stenosis Severity on Magnetic Resonance Imaging and Its Relation to Cross-Sectional Spinal Canal Area,” Spine 27 (2002): 1082, www. ncbi. nlm. nih. gov/pubmed/12004176.
- Жүрек ауруы — негізгі себеп: Centers for Disease Control and Prevention, “Heart Disease Facts,” accessed June 16, 2020, www. cdc. gov/heartdisease/facts. htm.
- Ертедегі зерттеу 31% құрайтынын анықтады: Timothy A. DeRouen et al. , “Variability in the Analysis of Coronary Arteriograms,” Circulation 55 (1977): 324, www. ncbi. nlm. nih. gov/pubmed/832349.
- Олар күрт келіспеді: Olaf Buchweltz et al. , “Interobserver Variability in the Diagnosis of Minimal and Mild Endometriosis,” European Journal of Obstetrics & Gynecology and Reproductive Biology 122 (2005): 213, www. ejog. org/article/S0301-2115(05)00059-X/pdf.
- туберкулез диагнозындағы айтарлықтай өзгермелілік: Jean-Pierre Zellweger et al. , “Intra-observer and Overall Agreement in the Radiological Assessment of Tuberculosis,” International Journal of Tuberculosis & Lung Disease 10 (2006): 1123, www. ncbi. nlm. nih. gov/pubmed/17044205. «Қанағаттанарлық» зерттеушілер арасындағы келісім үшін қараңыз: Yanina Balabanova et al. , “Variability in Interpretation of Chest Radiographs Among Russian Clinicians and Implications for Screening Programmes: Observational Study,” BMJ 331 (2005): 379, www. bmj. com/content/331/7513/379. short.
- әртүрлі елдердегі рентгенологтар арасында: Shinsaku Sakurada et al. , “Inter-Rater Agreement in the Assessment of Abnormal Chest X-Ray Findings for Tuberculosis Between Two Asian Countries,” BMC Infectious Diseases 12, article 31 (2012), https://bmcinfectdis. biomedcentral. com/articles/10. 1186/1471-2334-12-31.
- Сегіз патолог қарастырған: Evan R. Farmer et al. , “Discordance in the Histopathologic Diagnosis of Melanoma and Melanocytic Nevi Between Expert Pathologists,” Human Pathology 27 (1996): 528, www. ncbi. nlm. nih. gov/pubmed/8666360.
- Онкологиялық орталықта жүргізілген тағы бір зерттеу: Alfred W. Kopf, M. Mintzis, and R. S. Bart, “Diagnostic Accuracy in Malignant Melanoma,” Archives of Dermatology 111 (1975): 1291, www. ncbi. nlm. nih. gov/pubmed/1190800.
- Зерттеу авторлары мынадай қорытындыға келеді: Maria Miller and A. Bernard Ackerman, “How Accurate Are Dermatologists in the Diagnosis of Melanoma? Degree of Accuracy and Implications,” Archives of Dermatology 128 (1992): 559, https://jamanetwork. com/journals/jamadermatology/fullarticle/554024.
- Сол сияқты, жалған-позитивті көрсеткіштер де ауытқып тұрды: Craig A. Beam et al. , “Variability in the Interpretation of Screening Mammograms by US Radiologists,” Archives of Internal Medicine 156 (1996): 209, www. ncbi. nlm. nih. gov/pubmed/8546556.
- Рентгенологтар кейде мынаны ұсынады: P. J. Robinson et al. , “Variation Between Experienced Observers in the Interpretation of Accident and Emergency Radiographs,” British Journal of Radiology 72 (1999): 323, www. birpublications. org/doi/pdf/10. 1259/bjr. 72. 856. 10474490.
- ангиограммалардағы бітелу дәрежесі: Katherine M. Detre et al. , “Observer Agreement in Evaluating Coronary Angiograms,” Circulation 52 (1975): 979, www. ncbi. nlm. nih. gov/pubmed/1102142.
- Бұлдыр критерийлерді қамтитын салаларда: Horton et al. , “Inter- and Intra-Rater Reliability”; and Megan Banky et al. , “Inter- and Intra-Rater Variability of Testing Velocity When Assessing Lower Limb Spasticity,” Journal of Rehabilitation Medicine 51 (2019), www. medicaljournals. se/jrm/content/abstract/10. 2340/16501977-2496.
- Бірақ басқа бір зерттеу, қатысы жоқ: Esther Y. Hsiang et al. , “Association of Primary Care Clinic Appointment Time with Clinician Ordering and Patient Completion of Breast and Colorectal Cancer Screening,” JAMA Network Open 51 (2019), https://jamanetwork. com/journals/jamanetworkopen/fullarticle/2733171.
- Рөлдің тағы бір мысалы: Hengchen Dai et al. , “The Impact of Time at Work and Time Off from Work on Rule Compliance: The Case of Hand Hygiene in Health Care,” Journal of Applied Psychology 100 (2015): 846, www. ncbi. nlm. nih. gov/pubmed/25365728.
- үлкен үлес: Ali S. Raja, “The HEART Score Has Substantial Interrater Reliability,” NEJM J Watch, December 5, 2018, www. jwatch. org/na47998/2018/12/05/heart-score-has-substantial-interrater-reliability (reviewing Colin A. Gershon et al. , “Inter-rater Reliability of the HEART Score,” Academic Emergency Medicine 26 [2019]: 552).
- Біз атап өткендей, оқыту: Jean-Pierre Zellweger et al. , “Intra-observer and Overall Agreement in the Radiological Assessment of Tuberculosis,” International Journal of Tuberculosis & Lung Disease 10 (2006): 1123, www. ncbi. nlm. nih. gov/pubmed/17044205; Ibrahim Abubakar et al. , “Diagnostic Accuracy of Digital Chest Radiography for Pulmonary Tuberculosis in a UK Urban Population,” European Respiratory Journal 35 (2010): 689, https://erj. ersjournals. com/content/35/3/689. short.
- Сондай-ақ бірнешеуін біріктіру де солай: Michael L. Barnett et al. , “Comparative Accuracy of Diagnosis by Collective Intelligence of Multiple Physicians vs Individual Physicians,” JAMA Network Open 2 (2019): e19009, https://jamanetwork. com/journals/jamanetworkopen/fullarticle/2726709; Kimberly H. Allison et al. , “Understanding Diagnostic Variability in Breast Pathology: Lessons Learned from an Expert Consensus Review Panel,” Histopathology 65 (2014): 240, https://onlinelibrary. wiley. com/doi/abs/10. 1111/his. 12387.
- Олардың ең жақсылары мынадай болды: Babak Ehteshami Bejnordi et al. , “Diagnostic Assessment of Deep Learning Algorithms for Detection of Lymph Node Metastases in Women with Breast Cancer,” JAMA 318 (2017): 2199, https://jamanetwork. com/journals/jama/fullarticle/2665774.
- Терең оқыту алгоритмдері: Varun Gulshan et al. , “Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs,” JAMA 316 (2016): 2402, https://jamanetwork. com/journals/jama/fullarticle/2588763.
- Жасанды интеллект (ЖИ — адам интеллектісіне тән функцияларды орындайтын жасанды жүйе) қазір кем дегенде мынаны орындайды: Mary Beth Massat, “A Promising Future for AI in Breast Cancer Screening,” Applied Radiology 47 (2018): 22, www. appliedradiology. com/articles/a-promising-future-for-ai-in-breast-cancer-screening; Alejandro Rodriguez-Ruiz et al. , “Stand-Alone Artificial Intelligence for Breast Cancer Detection in Mammography: Comparison with 101 Radiologists,” Journal of the National Cancer Institute 111 (2019): 916, https://academic. oup. com/jnci/advance-article-abstract/doi/10. 1093/jnci/djy222/5307077.
- 3-кесте: Apgar Score, Medline Plus, https://medlineplus.gov/ency/article/003402.htm (соңғы рет 2020 жылғы 4 ақпанда қаралған).
- Апгар шкаласы бойынша бағалау шуды аз тудырады: L. R. Foster et al. , “The Interrater Reliability of Apgar Scores at 1 and 5 Minutes,” Journal of Investigative Medicine 54, no. 1 (2006): 293, https://jim. bmj. com/content/54/1/S308. 4.
- Бағалау мен ұпай қою салыстырмалы түрде: Warren J. McIsaac et al. , “Empirical Validation of Guidelines for the Management of Pharyngitis in Children and Adults,” JAMA 291 (2004): 1587, www. ncbi. nlm. nih. gov/pubmed/15069046.
- Бір зерттеу BI-RADS-тың мынаны анықтағанын көрсетті: Emilie A. Ooms et al. , “Mammography: Interobserver Variability in Breast Density Assessment,” Breast 16 (2007): 568, www. sciencedirect. com/science/article/abs/pii/S0960977607000793.
- Патологияда мыналар болды: Frances P. O’Malley et al. , “Interobserver Reproducibility in the Diagnosis of Flat Epithelial Atypia of the Breast,” Modern Pathology 19 (2006): 172, www. nature. com/articles/3800514.
- Осы себепті шуды азайту: See Ahmed Aboraya et al. , “The Reliability of Psychiatric Diagnosis Revisited,” Psychiatry (Edgmont) 3 (2006): 41, www. ncbi. nlm. nih. gov/pmc/articles/PMC2990547. Шолу үшін қараңыз: N. Kreitman, “The Reliability of Psychiatric Diagnosis,” Journal of Mental Science 107 (1961): 876–886, www. cambridge. org/core/journals/journal-of-mental-science/article/reliability-of-psychiatric-diagnosis/92832FFA170F4FF41189428C6A3E6394.
- 1964 жылғы 91 пациент қатысқан зерттеу: Aboraya et al. , “Reliability of Psychiatric Diagnosis Revisited,” 43.
- Бірақ алдын ала күш-жігерде: C. H. Ward et al. , “The Psychiatric Nomenclature: Reasons for Diagnostic Disagreement,” Archives of General Psychiatry 7 (1962): 198.
- «Даму дайындығы бар клиницист» болса да: Aboraya et al. , “Reliability of Psychiatric Diagnosis Revisited. ”
- DSM-III күрт өзгеріске әкелді: Samuel M. Lieblich, David J. Castle, Christos Pantelis, Malcolm Hopwood, Allan Hunter Young, and Ian P. Everall, “High Heterogeneity and Low Reliability in the Diagnosis of Major Depression Will Impair the Development of New Drugs,” British Journal of Psychiatry Open 1 (2015): e5–e7, www. ncbi. nlm. nih. gov/pmc/articles/PMC5000492/pdf/bjporcpsych_1_2_e5. pdf.
- Бірақ нұсқаулық өте алшақ болды: Lieblich et al. , “High Heterogeneity. ”
- Тіпті 2000 жылғы айтарлықтай қайта қараудан кейін де: See Elie Cheniaux et al. , “The Diagnoses of Schizophrenia, Schizoaffective Disorder, Bipolar Disorder and Unipolar Depression: Interrater Reliability and Congruence Between DSM-IV and ICD-10,” Psychopathology 42 (2009): 296–298, especially 293; and Michael Chmielewski et al. , “Method Matters: Understanding Diagnostic Reliability in DSM-IV and DSM-5,” Journal of Abnormal Psychology 124 (2015): 764, 768–769.
- «психиатриялық диагноздардың сенімділігін арттыру»: Aboraya et al. , “Reliability of Psychiatric Diagnosis Revisited,” 47.
- ауыр қауіп: Aboraya et al. , 47.
- Нұсқаулықтың тағы бір нұсқасы: See Chmielewski et al. , “Method Matters. ”
- Америкалық Психиатриялық Қауымдастық: See, for example, Helena Chmura Kraemer et al. , “DSM-5: How Reliable Is Reliable Enough? ,” American Journal of Psychiatry 169 (2012): 13–15.
- психиатрлар әлі де мынаны көрсетеді: Lieblich et al. , “High Heterogeneity. ”
- «психиатрларға қиынға соғады»: Lieblich et al. , “High Heterogeneity,” e-5.
- DSM-5 далалық сынақтары мынаны анықтады: Lieblich et al. , e-5.
- Кейбір далалық сынақтарға сәйкес: Lieblich et al. , e-6.
- Шектеулі болуының негізгі себебі: Aboraya et al. , “Reliability of Psychiatric Diagnosis Revisited,” 47.
Оларға мыналар кіреді (1) нақтылау: Aboraya et al.
- Бір бақылаушының сөзімен айтқанда: Aboraya et al.
- Медицина саласына көбірек қажет: Some valuable cautionary notes can be found in Christopher Worsham and Anupam B. Jena, “The Art of Evidence-Based Medicine,” Harvard Business Review, January 30, 2019, https://hbr. org/2019/01/the-art-of-evidence-based-medicine.
23-ТАРАУ
- бір газет тақырыбы: Jena McGregor, “Study Finds That Basically Every Single Person Hates Performance Reviews,” Washington Post, January 27, 2014.
- пайымдауға негізделгеннің барлық жерде болуы: Теория жүзінде, компаниялар енді әрбір жұмысшының өнімділігі туралы көптеген егжей-тегжейлі, нақты уақыт режимінде ақпарат жинай алады. Бұл деректер кейбір лауазымдар үшін толығымен алгоритмдік өнімділікті бағалауды мүмкін етуі мүмкін. Алайда біз мұнда өнімділікті өлшеуден пайымдауды толығымен алып тастау мүмкін емес лауазымдарға назар аударамыз. Қараңыз: E. D. Pulakos, R. Mueller-Hanson, and S. Arad, “The Evolution of Performance Management: Searching for Value,” Annual Review of Organizational Psychology and Organizational Behavior 6 (2018): 249–271.
- Көптеген зерттеушілер мынаны анықтады: S. E. Scullen, M. K. Mount, and M. Goff, “Understanding the Latent Structure of Job Performance Ratings,” Journal of Applied Psychology 85 (2000): 956–970.
- Қалған 70-80% ауытқу (вариация): Шағын компонент — кейбір зерттеулердегі жалпы ауытқудың 10%-ы — зерттеушілер «бағалаушы перспективасы» немесе «деңгей әсері» деп атайтын нәрсе. Бағалаушы перспективасы бір адамды бағалау кезінде бастықтың әріптесінен, ал әріптестің бағыныштысынан жүйелі түрде ерекшеленетінін көрсетеді. 360 градустық бағалау жүйелерінің нәтижелерін кеңінен түсіндіретін болсақ, бұл шу емес деп айтуға болады. Егер ұйымның әртүрлі деңгейлеріндегі адамдар бір адамның өнімділігінің әртүрлі жақтарын жүйелі түрде көрсе, олардың сол адам туралы пайымдауы жүйелі түрде ерекшеленуі керек және олардың рейтингтері мұны көрсетуі тиіс.
- бірнеше зерттеу: Scullen, Mount, and Goff, “Latent Structure”; C. Viswesvaran, D. S. Ones, and F. L. Schmidt, “Comparative Analysis of the Reliability of Job Performance Ratings,” Journal of Applied Psychology 81 (1996): 557–574. G. J. Greguras and C. Robie, “A New Look at Within-Source Interrater Reliability of 360-Degree Feedback Ratings,” Journal of Applied Psychology 83 (1998): 960–968; G. J. Greguras, C. Robie, D. J. Schleicher, and M. A. Goff, “A Field Study of the Effects of Rating Purpose on the Quality of Multisource Ratings,” Personnel Psychology 56 (2003): 1–21; C. Viswesvaran, F. L. Schmidt, and D. S. Ones, “Is There a General Factor in Ratings of Job Performance? A Meta-Analytic Framework for Disentangling Substantive and Error Influences,” Journal of Applied Psychology 90 (2005): 108–131; and B. Hoffman, C. E. Lance, B. Bynum, and W. A. Gentry, “Rater Source Effects Are Alive and Well After All,” Personnel Psychology 63 (2010): 119–151.
- «жұмыс өнімділігі арасындағы байланыс»: K. R. Murphy, “Explaining the Weak Relationship Between Job Performance and Ratings of Job Performance,” Industrial and Organizational Psychology 1 (2008): 148–160, especially 151.
- қызметкердің нақты өнімділігі: Шу көздерін талқылау кезінде біз кейбір қызметкерлерді немесе қызметкерлер санаттарын бағалаудағы жүйелі бұрмаланулардан туындайтын жағдайлық шудың мүмкіндігін ескермедік. Өнімділік рейтингтерінің өзгермелілігі туралы біз тапқан зерттеулердің ешқайсысы оларды сыртқы бағаланған «нақты» өнімділікпен салыстырмаған.
- адамдарды «стратегиялық түрде» бағалау: E. D. Pulakos and R. S. O’Leary, “Why Is Performance Management Broken? ,” Industrial and Organizational Psychology 4 (2011): 146–164; M. M. Harris, “Rater Motivation in the Performance Appraisal Context: A Theoretical Framework,” Journal of Management 20 (1994): 737–756; and K. R. Murphy and J. N. Cleveland, Understanding Performance Appraisal: Social, Organizational, and Goal-Based Perspectives (Thousand Oaks, CA: Sage, 1995).
- таза дамытушылық: Greguras et al. , “Field Study. ”
- объективті өлшенетін нәрсені болжайды: P. W. Atkins and R. E. Wood, “Self- Versus Others’ Ratings as Predictors of Assessment Center Ratings: Validation Evidence for 360-Degree Feedback Programs,” Personnel Psychology (2002).
- Тым күрделі сауалнамалар: Atkins and Wood, “Self- Versus Others’ Ratings. ”
- 98%: Olson and Davis, cited in Peter G. Dominick, “Forced Ranking: Pros, Cons and Practices,” in Performance Management: Putting Research into Action, ed. James W. Smither and Manuel London (San Francisco: Jossey-Bass, 2009), 411–443.
- мәжбүрлі рейтинг: Мұнда қызметкерлерді алдын ала белгіленген пайыздар бойынша топтарға бөлу жүйесі — мәжбүрлі рейтинг (forced ranking) қолданылады. Dominick, “Forced Ranking. ”
- өнімділік рейтингтерінде қолдану: Barry R. Nathan and Ralph A. Alexander, “A Comparison of Criteria for Test Validation: A Meta-Analytic Investigation,” Personnel Psychology 41, no. 3 (1988): 517–535.
- 17-сурет: Adapted from Richard D. Goffin and James M. Olson, “Is It All Relative? Comparative Judgments and the Possible Improvement of Self-Ratings and Ratings of Others,” Perspectives on Psychological Science 6, no. 1 (2011): 48–60.
- Deloitte: M. Buckingham and A. Goodall, “Reinventing Performance Management,” Harvard Business Review, April 1, 2015, 1–16, doi:ISSN: 0017-8012.
- Бір зерттеу: Corporate Leadership Council, cited in S. Adler et al. , “Getting Rid of Performance Ratings: Genius or Folly? A Debate,” Industrial and Organizational Psychology 9 (2016): 219–252.
- «Не болса да»: Pulakos, Mueller-Hanson, and Arad, “Evolution of Performance Management,” 250.
- «өнімділікті басқару революциясы»: A. Tavis and P. Cappelli, “The Performance Management Revolution,” Harvard Business Review, October 2016, 1–17.
- Дәлелдер мынаны көрсетеді: Frank J. Landy and James L. Farr, “Performance Rating,” Psychological Bulletin 87, no. 1 (1980): 72–107.
- Олар жұмыс өнімділігін бағалауды тәжірибеден өткізеді (бағалаудың дәлдігін арттыруға арналған арнайы жаттығулар): D. J. Woehr and A. I. Huffcutt, “Rater Training for Performance Appraisal: A Quantitative Review,” Journal of Occupational and Organizational Psychology 67 (1994): 189–205; S. G. Roch, D. J. Woehr, V. Mishra, and U. Kieszczynska, “Rater Training Revisited: An Updated Meta-Analytic Review of Frame-of-Reference Training,” Journal of Occupational and Organizational Psychology 85 (2012): 370–395; және M. H. Tsai, S. Wee, and B. Koh, “Restructured Frame-of-Reference Training Improves Rating Accuracy,” Journal of Organizational Behavior (2019): 1–18, doi:10. 1002/job. 2368.
- 18-сурет: Сол жақтағы панель Richard Goffin және James M. Olson-ның “Is It All Relative? Comparative Judgments and the Possible Improvement of Self-Ratings and Ratings of Others,” Perspectives on Psychological Science 6, no. 1 (2011): 48–60 еңбегінен бейімделген.
- Зерттеулердің көпшілігі: Roch et al. , “Rater Training Revisited. ”
- «жарық жұлдыз» таланттар (ерекше жоғары өнімділік көрсететін қызметкерлер): Ernest O’Boyle and Herman Aguinis, “The Best and the Rest: Revisiting the Norm of Normality of Individual Performance,” Personnel Psychology 65, no. 1 (2012): 79–119; және Herman Aguinis and Ernest O’Boyle, “Star Performers in Twenty-First Century Organizations,” Personnel Psychology 67, no. 2 (2014): 313–350.
- «Бұл сирек кездеседі»: A. I. Huffcutt and S. S. Culbertson, “Interviews,” in S. Zedeck, ed. , APA Handbook of Industrial and Organizational Psychology (Washington, DC: American Psychological Association, 2010), 185–203.
- Белгілі бір дәрежеде өздерінің интуитивті пайымдауларына сүйенеді: N. R. Kuncel, D. M. Klieger, and D. S. Ones, “In Hiring, Algorithms Beat Instinct,” Harvard Business Review 92, no. 5 (2014): 32.
- «ең басты мәселе» (қызметкерлерді іріктеу мен жалдаудың негізгі қиындығы): R. E. Ployhart, N. Schmitt, and N. T. Tippins, “Solving the Supreme Problem: 100 Years of Selection and Recruitment at the Journal of Applied Psychology,” Journal of Applied Psychology 102 (2017): 291–304.
- Басқа зерттеулердің мәліметтері: M. McDaniel, D. Whetzel, F. L. Schmidt, and S. Maurer, “Meta Analysis of the Validity of Employment Interviews,” Journal of Applied Psychology 79 (1994): 599–616; A. Huffcutt and W. Arthur, “Hunter and Hunter (1984) Revisited: Interview Validity for Entry-Level Jobs,” Journal of Applied Psychology 79 (1994): 2; F. L. Schmidt and J. E. Hunter, “The Validity and Utility of Selection Methods in Personnel Psychology: Practical and Theoretical Implications of 85 Years of Research Findings,” Psychology Bulletin 124 (1998): 262–274; және F. L. Schmidt and R. D. Zimmerman, “A Counterintuitive Hypothesis About Employment Interview Validity and Some Supporting Evidence,” Journal of Applied Psychology 89 (2004): 553–561.
Ескерту: зерттеулердің белгілі бір топтарын қарастырғанда, әсіресе әкімшілік рейтингтердің орнына осы мақсат үшін арнайы жасалған өнімділік рейтингтері қолданылса, валидтілік (көрсеткіштің негізділігі) деңгейі жоғары болады.
- objective ignorance (объективті білімсіздік — болжам жасау мүмкін емес жағдайдағы шешім қабылдау): S. Highhouse, “Stubborn Reliance on Intuition and Subjectivity in Employee Selection,” Industrial and Organizational Psychology 1 (2008): 333–342; D. A. Moore, “How to Improve the Accuracy and Reduce the Cost of Personnel Selection,” California Management Review 60 (2017): 8–17.
- Өздеріне мәдени жағынан ұқсас келетіндер: L. A. Rivera, “Hiring as Cultural Matching: The Case of Elite Professional Service Firms,” American Sociology Review 77 (2012): 999–1022.
- Корреляция өлшемдері: Schmidt and Zimmerman, “Counterintuitive Hypothesis”; Timothy A. Judge, Chad A. Higgins, and Daniel M. Cable, “The Employment Interview: A Review of Recent Research and Recommendations for Future Research,” Human Resource Management Review 10 (2000): 383–406; және A. I. Huffcutt, S. S. Culbertson, and W. S. Weyhrauch, “Employment Interview Reliability: New Meta-Analytic Estimates by Structure and Format,” International Journal of Selection and Assessment 21 (2013): 264–276.
- Маңызды, тіпті өте маңызды: M. R. Barrick et al. , “Candidate Characteristics Driving Initial Impressions During Rapport Building: Implications for Employment Interview Validity,” Journal of Occupational and Organizational Psychology 85 (2012): 330–352; M. R. Barrick, B. W. Swider, and G. L. Stewart, “Initial Evaluations in the Interview: Relationships with Subsequent Interviewer Evaluations and Employment Offers,” Journal of Applied Psychology 95 (2010): 1163.
- Қол алысудың сапасы: G. L. Stewart, S. L. Dustin, M. R. Barrick, and T. C. Darnold, “Exploring the Handshake in Employment Interviews,” Journal of Applied Psychology 93 (2008): 1139–1146.
- Оң бірінші әсер: T. W. Dougherty, D. B. Turban, and J. C. Callender, “Confirming First Impressions in the Employment Interview: A Field Study of Interviewer Behavior,” Journal of Applied Psychology 79 (1994): 659–665.
- Бір таңқаларлық экспериментте: J. Dana, R. Dawes, and N. Peterson, “Belief in the Unstructured Interview: The Persistence of an Illusion,” Judgment and Decision Making 8 (2013): 512–520.
- HR мамандары қолдайды: Nathan R. Kuncel et al. , “Mechanical versus Clinical Data Combination in Selection and Admissions Decisions: A Meta-Analysis,” Journal of Applied Psychology 98, no. 6 (2013): 1060–1072.
- «нөлдік байланыс» (екі көрсеткіш арасындағы тәуелділіктің мүлдем болмауы): Laszlo Bock-тың Adam Bryant-қа берген сұхбаты, The New York Times, 19 маусым, 2013 жыл. Сондай-ақ қараңыз: Laszlo Bock, Work Rules! : Insights from Inside Google That Will Transform How You Live and Lead (New York: Hachette, 2015).
- Бір танымал «бас аңшы» (headhunter): C. Fernández-Aráoz, “Hiring Without Firing,” Harvard Business Review, 1 шілде, 1999 жыл.
- structured behavioral interviews (құрылымдалған мінез-құлық сұхбаттары — алдын ала дайындалған сұрақтар арқылы үміткердің өткен тәжірибесін бағалау): Құрылымдалған сұхбаттар туралы түсінікті нұсқаулықты қараңыз: Michael A. Campion, David K. Palmer, and James E. Campion, “Structuring Employment Interviews to Improve Reliability, Validity and Users’ Reactions,” Current Directions in Psychological Science 7, no. 3 (1998): 77–82.
- Сәйкес келу үшін міндетті түрде қамтылуы тиіс: J. Levashina, C. J. Hartwell, F. P. Morgeson, and M. A. Campion, “The Structured Employment Interview: Narrative and Quantitative Review of the Research Literature,” Personnel Psychology 67 (2014): 241–293.
- Құрылымдалған сұхбаттар әлдеқайда болжамды: McDaniel et al. , “Meta Analysis”; Huffcutt and Arthur, “Hunter and Hunter (1984) Revisited”; Schmidt and Hunter, “Validity and Utility”; және Schmidt and Zimmerman, “Counterintuitive Hypothesis. ”
- work sample tests (жұмыс үлгісінің сынақтары — үміткердің нақты тапсырманы орындау қабілетін тексеру): Schmidt and Hunter, “Validity and Utility. ”
- Израиль армиясы: Kahneman, Thinking, Fast and Slow, 229.
- Практикалық кеңес: Kuncel, Klieger, and Ones, “Algorithms Beat Instinct. ” Сондай-ақ қараңыз: Campion, Palmer, and Campion, “Structuring Employment Interviews. ”
- «Иллюзияның сақталуы»: Dana, Dawes, and Peterson, “Belief in the Unstructured Interview. ”
25-ТАРАУ
- mediating assessments protocol (аралық бағалау хаттамасы — стратегиялық шешімдер қабылдау кезінде қателіктерді азайтуға арналған құрылымдалған әдіс): Daniel Kahneman, Dan Lovallo, and Olivier Sibony, “A Structured Approach to Strategic Decisions: Reducing Errors in Judgment Requires a Disciplined Process,” MIT Sloan Management Review 60 (2019): 67–73.
- estimate-talk-estimate (бағалау-талқылау-бағалау — топтық шешім қабылдау кезіндегі итерациялық процесс): Andrew H. Van De Ven and André Delbecq, “The Effectiveness of Nominal, Delphi, and Interacting Group Decision Making Processes,” Academy of Management Journal 17, no. 4 (1974): 605–621. Сондай-ақ 21-тарауды қараңыз.
6-БӨЛІМ
- Олардың пікірінше: Kate Stith and José A. Cabranes, Fear of Judging: Sentencing Guidelines in the Federal Courts (Chicago: University of Chicago Press, 1998), 177.
26-ТАРАУ
- Біріншіден, мұндай күш-жігер: Albert O. Hirschman, The Rhetoric of Reaction: Perversity, Futility, Jeopardy (Cambridge, MA: Belknap Press, 1991).
- Вацлав Гавелден дәйексөз келтіре отырып: Stith and Cabranes, Fear of Judging.
- «үш соққы және сен ойыннан шықтың» (қылмысты үшінші рет қайталағанда қатаң жаза қолдану ережесі): Қараңыз, мысалы: Three Strikes Basics, Stanford Law School, https://law. stanford. edu/stanford-justice-advocacy-project/three-strikes-basics/.
- «Вудсон Солтүстік Каролинаға қарсы»: 428 U. S. 280 (1976).
- Соқыр сенімді ұялатуы мүмкін: Cathy O’Neil, Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy (New York: Crown, 2016).
- «Ықтимал бейімделген»: Will Knight, “Biased Algorithms Are Everywhere, and No One Seems to Care,” MIT Technology Review, 12 шілде, 2017 жыл.
- ProPublica: Jeff Larson, Surya Mattu, Lauren Kirchner, and Julia Angwin, “How We Analyzed the COMPAS Recidivism Algorithm,” ProPublica, 23 мамыр, 2016 жыл, www. propublica. org/article/how-we-analyzed-the-compas-recidivism-algorithm. Осы мысалдағы бейімділік (bias) туралы шағым даулы болып табылады және бейімділіктің әртүрлі анықтамалары қарама-қайшы қорытындыларға әкелуі мүмкін. Осы оқиғаға қатысты және алгоритмдік бейімділіктің анықтамасы мен өлшемі туралы кеңірек мәлімет алу үшін төмендегі «Дәл қалай тексеру керек» деген ескертпені қараңыз.
- predictive policing (болжамды полиция қызметі — қылмыстың алдын алу үшін деректерді талдау): Aaron Shapiro, “Reform Predictive Policing,” Nature 541, no. 7638 (2017): 458–460.
- Расында да, бұл тұрғыда алгоритмдер: Бұл мәселе Жасанды Интеллект (ЖИ) негізіндегі модельдер контекстінде қайта көтерілгенімен, бұл тек ЖИ-ге ғана тән емес. 1972 жылдың өзінде-ақ Пол Слович интуицияны модельдеу бар танымдық ауытқуларды сақтап, нығайта түсетінін, тіпті оларды ұлғайтуы мүмкін екенін атап өткен болатын. Paul Slovic, “Psychological Study of Human Judgment: Implications for Investment Decision Making,” Journal of Finance 27 (1972): 779.
- Дәл қалай тексеру керек: COMPAS қайталама қылмысты болжау алгоритмі төңірегіндегі қайшылықтар контекстіндегі бұл пікірталаспен танысу үшін қараңыз: Larson et al. , “COMPAS Recidivism Algorithm”; William Dieterich et al. , “COMPAS Risk Scales: Demonstrating Accuracy Equity and Predictive Parity,” Northpointe, Inc. , 8 шілде, 2016 жыл; Julia Dressel and Hany Farid, “The Accuracy, Fairness, and Limits of Predicting Recidivism,” Science Advances 4, no. 1 (2018): 1–6; Sam Corbett-Davies et al. , “A Computer Program Used for Bail and Sentencing Decisions Was Labeled Biased Against Blacks. It’s Actually Not That Clear,” Washington Post, 17 қазан, 2016 жыл; Alexandra Chouldechova, “Fair Prediction with Disparate Impact: A Study of Bias in Recidivism Prediction Instruments,” Big Data 153 (2017): 5; және Jon Kleinberg, Sendhil Mullainathan, and Manish Raghavan, “Inherent Trade-Offs in the Fair Determination of Risk Scores,” Leibniz International Proceedings in Informatics, қаңтар 2017 жыл.
27-ТАРАУ
- Олар өздерінің ... білуі мүмкін: Tom R. Tyler, Why People Obey the Law, 2-бас. , (New Haven, CT: Yale University Press, 2020).
- Америка құқығындағы таңқаларлық шешім: Cleveland Bd. of Educ. v. LaFleur, 414 U. S. 632 (1974).
- Сол кездегі беделді комментаторлар: Laurence H. Tribe, “Structural Due Process,” Harvard Civil Rights–Civil Liberties Law Review 10, no. 2 (көктем 1975): 269.
- Өте теріс реакцияны еске түсіріңіз: Stith and Cabranes, Fear of Judging, 177.
- Бірқатар белсенді әрекеттерде: Қараңыз, мысалы: Philip K. Howard, The Death of Common Sense: How Law Is Suffocating America (New York: Random House, 1995); және Philip K. Howard, Try Common Sense: Replacing the Failed Ideologies of Right and Left (New York: W. W. Norton & Company, 2019).
28-ТАРАУ
- 2020 жылғы Facebook-тің Қауымдастық стандарттары: 12. Hate Speech (Өшпенділік тілі), Facebook: Community Standards, www. facebook. com/communitystandards/hate_speech.
- The New Yorker: Andrew Marantz, “Why Facebook Can’t Fix Itself,” The New Yorker, 12 қазан, 2020 жыл.
- noisy judgments (шулы пайымдаулар — бірдей жағдайлардағы шешімдердің негізсіз алшақтығы): bureaucratic justice (бюрократиялық әділдік — әкімшілік жүйелердегі заңдылық): Jerry L. Mashaw, Bureaucratic Justice (New Haven, CT: Yale University Press, 1983).
- Керісінше, бұл жағдай негізінен орын алды: David M. Trubek, “Max Weber on Law and the Rise of Capitalism,” Wisconsin Law Review 720 (1972): 733, n. 22 (Max Weber-ден дәйексөз келтірілген, The Religion of China [1951], 149).

Авторлар туралы
Даниэль Канеман
Даниэль Канеман — Принстон университетінің психология және қоғамдық мәселелер бойынша құрметті профессоры, 2002 жылғы Экономика ғылымдары бойынша Нобель сыйлығының және 2013 жылғы Президенттік Еркіндік медалінің иегері. Канеман Америка өнер және ғылым академиясының және Ұлттық ғылым академиясының мүшесі болып табылады. Ол Америка психологиялық қауымдастығының, Америка психологиялық қоғамының, Эксперименттік психологтар қоғамының және Эконометрикалық қоғамның мүшесі (fellow). Ол көптеген марапаттардың иегері, соның ішінде Америка психологиялық қауымдастығының «Ғылымға қосқан зор үлесі үшін» сыйлығы, Эксперименттік психологтар қоғамының Уоррен медалі, жалпы психологияға қосқан үлесі үшін Хилгард сыйлығы және Америка психологиялық қауымдастығының «Өмір бойғы жетістіктері үшін» сыйлығы бар. Ол New York Times бестселлері — «Ойлау: жылдам және баяу» (Thinking, Fast and Slow) кітабының авторы. Нью-Йорк қаласында тұрады.

Оливье Сибони
Оливье Сибони — HEC Paris профессоры және Оксфорд университеті жанындағы Saïd бизнес мектебінің қауымдастырылған мүшесі. Бұған дейін ол McKinsey & Company компаниясының Париж және Нью-Йорк кеңселерінде жиырма бес жыл жұмыс істеп, аға серіктес болған. Сибонидің стратегиялық шешімдер қабылдау сапасын арттыру бойынша зерттеулері көптеген басылымдарда, соның ішінде Harvard Business Review және MIT Sloan Management Review-де жарияланған. Ол HEC Paris түлегі және Париж ғылым және әдебиет университетінің (Université Paris Sciences et Lettres) PhD докторы дәрежесіне ие. Ол «Сіз үлкен қателік жасайын деп тұрсыз! » (You’re About to Make a Terrible Mistake! ) кітабының авторы. Парижде тұрады. Twitter: @siboliv

Касс Р. Санстейн
Касс Р. Санстейн — Гарвард университетінің Роберт Уолмсли атындағы профессоры, онда Мінез-құлық экономикасы және мемлекеттік саясат бағдарламасының негізін қалаушы әрі директоры болып табылады. 2009 жылдан 2012 жылға дейін ол Ақ үйдің Ақпарат және реттеу мәселелері жөніндегі басқармасының әкімшісі болды. 2013 жылдан 2014 жылға дейін Президент Обаманың барлау және байланыс технологиялары жөніндегі сарапшылар тобында қызмет етті. Норвегия үкіметінің 2018 жылғы Хольберг сыйлығының иегері Санстейн көптеген мақалалар мен кітаптардың авторы, соның ішінде екі New York Times бестселлері бар: «Жұлдызды соғыстар бойынша әлем» (The World According to Star Wars) және «Nudge» (Ричард Талермен бірге). Оның басқа кітаптарының қатарында «Өзгерістер қалай болады» (How Change Happens) және «Тым көп ақпарат» (Too Much Information) бар. Twitter: @casssunstein
Пікірлер (0)
Пікір жазу үшін аккаунтқа кіріңіз. Кіру