Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

Психология->Реферат
Общение — обмен сведениями с помощью языка или жестов, а также иных способов контакта. Общение — это коммуникационное взаимодействие людей или социаль...полностью>>
Психология->Реферат
В процессе познания действительности человек по-разному относится к объектам и явлениям ок­ружающего мира. К некоторым он испытывает симпатию, чему-то...полностью>>
Психология->Курсовая работа
Больших объединений, возникающих формальным или неформальным образом, находится в центре внимания исследователей различных наук и школ. Проблема групп...полностью>>
Психология->Закон
Согласно Закону РФ «О частной детективной и охранной деятельности в Российской Федерации», частным детективом признается гражданин Российской Федераци...полностью>>

Главная > Курсовая работа >Психология

Сохрани ссылку в одной из сетей:

Ось порівняння мозку і комп’ютеру, що приводить Солсо.

Кремнієві комп'ютери

Вуглеводневий мозок

Швидкість обробки

Наносекунди

Від мілесекунд до секунд

Тип

Послідовний процесор

Параллельний процессор

Ємність пам'ті

Більша для оцифрованої інформації

Більша для зорової і мовної інформації

Матеріал

Кремній і систма електронного забезпечення

Нейрони і система органічного забезпечення

Взаємодія

Абсолютно керований

Має власну точку зору

Здатність до навчання

Керується правилами

Понятійний

Краща якість

Швидкість обробки інформації, керованість, передбвчуваність

Легко робить висновки, узагальнення, виносить судження. Мобільний.

Найгірша якість

Не може вчитися самостійно, погано виконує складні когнітивні функції, знижена мобільність.

Має обмежену здатність до обробки і збереженння інформації, здатен до забування.

Для того, щоб поглибити досягнення у сфері штучного інтелекту слід спершу відповісти на питання як машина може імітувати мислення людини. Однією з найпоширеніших відповідей на цей час є така, що приймає точку зору коннекціонізму. Тобто сверджується, що найкращим способом є моделювання машин за принципом будови основних нервових структур.

Також, на основ відповіді на попереднє питання виникає нове, що постає основною проблемою на сучасному етапі розвитку наук, що займаються створенням штучного інтелекту. Якщо змоделювати штучну людину, при цьому врахувавши всі недоліки справжньої істоти, чи можливо, щоб комп’ютер перевершив живу істоту? Адже вже зараз деякі програми працюють ефективніше за людське мислення. Але більшість з них, на даний момент, лише грубі бідробки тонкого мисленнєвого апарату людського мислення. Комп'ютери можуть вирішувати деякі завдання, наприклад складні математичні, швидше і точніше, ніж люди, але завдання, що вимагають узагальнень та навчання новим патернам поведінки, люди вирішують краще комп'ютерів.

Для більш-менш об’єктивного порівняння можливостей мозку і комп’ютеру можна взяти показник потужності кожного. Спробуємо оцінити потужність людського мозку комп'ютерними мірками. Він складається з приблизно 100 млрд. нейронів. Кожен нейрон представляє собою мініатюрний «процесор» і пов'язаний з іншими нейронами 5 тисячами синапсів. У зв'язку з хімічною природою передачі інформації, затримка нейрона становить 0.01 сек., тобто робоча частота нейрона близько 100 Гц. Кожен сигнал синапсу можна оцінити приблизно в 5 біт. В результаті отримуємо потужність одного нейрона – 1000000 оп / с. Для всього мозку - 10 ^ 17 оп / с. На сьогоднішній день середній домашній комп'ютер володіє продуктивністю 10 ^ 9 оп / с, найпотужніші у світі комп'ютери - приблизно 10 ^ 13 оп / с, що поки в 10 тисяч разів менше потужності людського мозку.

Слід враховувати, що просте порівняння потужності не може охарактеризувати ефективність інтелекту. Людський мозок має оптимізовану найкращим чином організацію, здатність використовувати досвід минулих поколінь, володіє самонавчанням, самореструктурізаціею. Щоб оцінити продуктивність одного тільки зорового апарату людини досить згадати, що кожну 1/16 секунди він аналізує зображення, що в тисячі разів перевищуе здатність до розрішення найсучасніших фотокамер. За цей час мозок встигає виділити окремі об'єкти, співвіднести їх з минулим досвідом, зарахувати до певних груп, зіставити інформацію лівого і правого ока, на підставі чого прорахувати відстань до кожного з об'єктів, направити зіницю в найбільш ефективну крапку в контексті досліджуваного образу.

Отже, наврядчи на даному етапі можна говорити про вже існуюче перевершення людського мозку штучним інтелектом. Поки що не збудуться жахи, що вже давно передрікає нам наукова фантастика.

Приклади існування штучного інтелекту

Позиціюючи проблему штучного інтелекту як дуже актуальну і сучасну, неможливо не токнутися того, як саме він використовується в сучасному суспільстві. Так як ми розглядаємо штучний інтелект з психологічної точки зору, слід також охопити віяння, які він привносить до свідомості суспільства.

Шаховий комп’ютер

Майбуть найпопулярнішим прикладом штучного інтелекту є шаховий комп'ютер - спеціалізований комп'ютер для гри в шахи. Ідея автомата, що дозволяв би грати у шахи за відсутності партнера виникла ще в 18 столітті. У СРСР з середини 80 років випускалися споживчі шахові комп'ютери

Сьогодні шахові програми використовуються доволі повсякденно, як і задумувалося в 18 столітті, вони допомагають замінити реального супротивника. Іноді, навіть, перемагають чемпіонів світу. Наприклад один з матчів Каспарова і DeepBlue завершився нічиєю. Але що саме лежить в основі висловлювання «комп’ютер проти людини»?

Алгоритм, який використовується програмістами IBM, призначений для пошуку потрібних ходів серед усіх можливих комбінацій. Обмежені апаратні засоби, у свою чергу, змушують вчених шукати варіанти зменшення часу пошуку без значної втрати якості. За словами Кемпбелла, алгоритм Deep Blue передбачає кількісну оцінку кожного ходу. Оцінюється він за наступними параметрами:

1. Чи дасть перевагу на дошці? Ходи, що ведуть до поразки комп'ютера, відкидаються відразу ж.

2. Популярність даного ходу. Для цього в Deep Blue довелося впровадити базу даних з інформацією про шахові поєдинки серед професіоналів. Хід, до якого в схожій ситуації вдалися багато хто з гросмейстерів, має шанси заробити більше "очок".

3. Рівень майстерності гросмейстерів, які скористалися цим ходом. Таким чином, хід, зроблений чемпіоном світу, отримує більш високу оцінку.

4. Відносна частота даного ходу. Чим частіше хід зустрічається в інших іграх, тим вище ймовірність його оптимальності в схожій ситуації.

5. Наявність коментарів до ходу. Багато спортивних коментаторів у репортажах з шахових матчів вказують на сильні і слабкі ходи гросмейстерів. Якщо певний хід був названий "сильним", то його шанси стати обраним зростають.

Як видно, ніякої містики в роботі DeepBlue немає. В основному наявність "розумної" програми передбачає реалізацію в ній якісного механізму відбору комбінацій. Тому і словосполучення "людина проти комп'ютера" в даному випадку втрачає сенс, тому що з іншої сторони дошки знаходиться не "інтелектуальна" машина або комп'ютерний продукт, а всього лише програма, розроблена і впроваджена все тими ж homo sapiens.

MYCIN

Це експертна система, розроблена на початку 1970х років в Стендфордскому університеті. MYCIN була спроектована для діагностування бактерій, що викликають важкі інфекції, такі як бактеріємія і менінгіт, а також для рекомендації необхідної кількості антибіотиків в залежності від маси тіла пацієнта. Також MYCIN використовувалася для діагностики захворювань згортання крові.

MYCIN оперувала за допомогою досить простої машини виводу, і база знань з приблизно 600 правил. Після запуску, програма ставила користувачеві (лікарю) довгий ряд простих «так / ні» або текстових питань. В результаті, система надавала список підозрюваних бактерій, відсортований за ймовірністю, надавала список питань і правил, які привели її до саме такого ранжування діагнозів, а також рекомендувала курс лікування.

Незважаючи на успіх MYCIN, вона викликала дебати з приводу правомірності її виводів. Дослідження, проведені в Stanford Medical School, виявили, що MYCIN пропонує прийнятну терапію приблизно у 69% випадків, що краще, ніж у експертів з інфекційних хвороб, яких оцінювали за тими ж критеріями. Фактично, MYCIN ніколи не використовувалася на практиці. І не через низьку її ефективність. Деякі дослідники піднімали етичні та правові питання, пов'язані з використанням комп'ютерів в медицині - якщо програма дає неправильний прогноз або пропонує неправильне лікування, хто має відповідати за це? Тим не менше, найбільшою проблемою і справжньою причиною, чому MYCIN не використовується у повсякденній практиці, був стан технологій. У наш час, подібна система була б інтегрована з системою медичних записів, отримувала б відповіді на свої запитання з бази даних про пацієнтів, і була б значно менш залежна від введення інформації лікарем. У 1970-х, сеанс роботи з MYCIN міг легко зайняти 30 хвилин і більше - що становить неприпустимі втрати часу.

Головними труднощами, з якою зіткнулися по час розробки MYCIN і наступних експертних систем, було «витяг» знань з досвіду людей-експертів для формування бази правил. Зараз даними питаннями займається інженерія знань.

Розпізнавання мовлення

Перший пристрій для розпізнавання мовлення з'явилося в 1952 році, воно могло розпізнавати вимовлені людиною цифри. Комерційні програми з розпізнавання голосу з'явилися на початку 90 років. Зазвичай їх використовують люди, які через травми рук не в змозі набирати велику кількість тексту. Наприклад, Dragon NaturallySpeaking, Voice Navigator. Збільшення обчислювальних потужностей мобільних пристроїв дозволило і для них створити програми з функцією розпізнавання мови. Серед таких програм варто відзначити Microsoft Voice Command. Інтелектуальні мовні рішення, що дозволяють автоматично синтезувати і розпізнавати людську мову, є наступним етапом розвитку інтерактивних голосових систем (IVR). Останнім часом у телефонних інтерактивних програмах все частіше використовують системи автоматичного розпізнавання і синтезу мови. При цьому системи розпізнавання є незалежними від дикторів, тобто розпізнають голос будь-якої людини. Наступним кроком технологій розпізнавання мовлення можна вважати розвиток так званих Silent Speech Interfaces (SSI) (Інтерфейсів безмовного Доступу). Ці системи обробки мовлення базуються на одержанні й обробці мовних сигналів на ранній стадії артикулювання. Даний етап розвитку розпізнавання мовлення викликаний двома істотними недоліками сучасних систем розпізнавання: надмірна чутливість до шумів, а також на необхідності чіткої і ясної мови при зверненні до системи розпізнавання. Підхід, заснований на SSI, полягає в тому, щоб використовувати нові сенсори, які не піддаються впливу шумів як доповнення до оброблених акустичним сигналами.

Класифікація систем розпізнавання мовлення

За якостями

За роміром словника

Диктозалежні

Дикто незалежні

Обмежений темою набір слів

Словник великого розміру

За типом структурної одиниці

Аллофон

Фонема

Дифон, трифон

Слово, фраза

За типом мовлення

За метою

Ізольовані слова

Цілісне мовлення

Командні системи

Системи диктування

Системи розпізнавання

За механізмом функціонування

Найпростіші детектори

Експертні системи

Вірогіднісно-мережеві системи

Зворотні задачі

Також існує безліч менш глобальних, але безперечно цікавих і оригінальних винаходів. Таких як, наприклад в той час як американські вчені минулого покоління безуспішно намагалися побудувати комп'ютер, подібний мозку, японський вчений створив такий комп'ютер, використовуючи реальні нервові клітини, змішані з електронними пристроями, в спробі виготовити на половину штучну нейронну мережу. Він успішно поєднав клітини з напівпровідниковю сумішшю індію та окису олова і виявив, що при дуже слабкій електричній стимуляції органічні клітини реагують керованим зростанням. Занадто рано думати про штучний мозкок, але подібні пристрої могли б виступити в ролі інтерфейсу між нервовою системою і такими протезами, як штучні очі.

(Малюнок ілюструє ріст клітин при малому електричному стимулюванні)

Також одним з популярних нині напрямків є робототехніка. На даний момент існує велика кількість видів роботів. Від звичайних маніпуляторів до таких, для створення яких використовується штучний інтелект. Найближчим до нас прикладом такого «розумного» роботу може бути Sam. Він був створений фірмою Samsung на базі нетбука і запущений до найбільших вузів України. Мета цього – привернення уваги молоді до передових інформаційних технологій.

Під час турне робот має спілкуватися зі студентами, встановлюючи при цьому справжній живий діалог. Щоб зав'язати спілкування, SAM має під'їжджати до студентів і, наприклад, питати, як потрапити в деканат, бібліотеки або кабінет ректора. Його співрозмовники, у свою чергу, можуть вводити свої питання в чат-інтерфейсі на клавіатурі нетбука Samsung і отримувати відповіді. Причому SAM може не просто виводити відповіді на екран нетбука в вигляді тексту, але і озвучувати їх.

Турне робота охопить усі куточки країни - від Львова до Донецька і від Києва до Одеси.». 12 травня робот відвідав ряд корпусів Київського національного університету ім. Т. Шевченка. «SAM уособлює симбіоз реального та віртуального спілкування, звичний для активних користувачів соціальних мереж.», - зазначив Костянтин Череповський, PR-менеджер компанії« Samsung Electronics Україна». На власному досвіді спілкування з даним представником сучасної «інтелектуальної» теми я можу сказати, що він має досить дружній інтерфейс. Зображення очей на екрані, що рухаються в момент, коли комп’ютер обробляє відповідь, дещо посилює враження живого спілкування. Також SAM підтримує відносно живий і інтнлнктуальних діалог, за допомогою вбудованої веб камери може розпізнавати зображення (наприклад наявність окулярів на обличчі). Одним з помічених мною недоліків є затримка з відповіддю. Іноді обробка її вимагає досить великого часу. Також відчуття «живого діалогу», який постульований компанією виробником, дещо знижується через необхідність вводити відповіді з клавіатури. Загалом така подія має стати вельми захоплюючим і інформативним досвідом для студентів вузів, в яках SAM побуває.

Ставлення суспільства

Таке глибоке входження штучного інтелекту в наше повсякденне життя не може не викликати появи різних суджень і точок зору з цього приводу.

Якщо розглядати тенденції, що намітилися серед світових релігій, то загалом вони не заперечують можливості створення штучного інтелекту, а деякі навіть активно підтримують. Цікавою є точки зору послідовників авраамічних релігій. За однією з них мозок, роботу якого намагаються імітувати системи не бере участі в процесі мислення, не є джерелом свідомості і будь-який інший розумової діяльності. Відповідно до іншої, мозок бере участь в процесі мислення, але у вигляді «передавача» інформації від душі. Мозок відповідальний за такі «прості» функції, як безумовні рефлекси, реакція на біль тощо. Обидві позиції, на даний момент, зазвичай не визнаються наукою, так як поняття душа не розглядається сучасною наукою в якості наукової категорії.

Найкраще, на мою думку, сучасне ставлення суспільства до ідеї створення штучного інтелекту відображає мистецтво. Наприклад науково-фантастичні фільми, романи, тощо.

У науково-фантастичній літературі штучний інтелект частіше всього зображується як сила, яка намагається повалити владу людини («Космічна одіссея 2001 року», Скайнет, Colossus, «Матриця», «Той, що біжить по лезу») або обслуговуючий гуманоїд («Двохсотрічна людина», «Зоряні війни»).

Цікаве бачення майбутнього представлено в романі «Вибір за Т'юрингом» письменника-фантаста Гаррі Гаррісона і вченого Марвіна Мінські. Автори міркують на тему втрати людяності в людини, у мозок якого була вживлена ЕОМ, і придбання людяності машиною з штучним інтелектом, в пам'ять якої була скопійована інформація з головного мозку людини. Деякі наукові фантасти, наприклад Вернор Віндж (Grimm’s World, The Witling, A Fire Upon the Deep), також роздумували над наслідками появи штучного інтелекту, яке, мабуть, викличе різкі драматичні зміни в суспільстві. Одні з найбільш глибоких досліджень проблематики штучного інтелекту проявляються у творчості фантаста і філософа Станіслава Лемма, що напсав такі відомі твори як Солярис, Людина з Марса, Кіберіада, Казки роботів, тощо.

Отже, загалом можна підвести підсумок, що загалом людство не довіряє таким складним технологіям і в деякій мірі боїться їх не контрольованості,але разом з тим радо користується досягненнями вчених у цій сфері не задумуючись над цим. Про це можна судити з того, що тема штучного розуму, що захопив світ є досить розповсюдженою і популярною. Але окремі особистості, що схильні глибше іти у своєму пізнанні і розумінні проблеми штучного інтелекту, натикаються на величезну кількість етичних і глибоко філософських проблем, що він підіймає самою можливістю свого існування.

Частина ІІІ. Гностична діяльність штучного інтелекту

Гностичну діяльність машини я розгляну на прикладі комп’ютерного зору і сприймання мови. Зорова модальність – найголовніша для людини, так як машини у пізнанні світу імітують нас, то і в них зорове пізнання лишається одним основних джерел інформації. Проблеми мовлення я торкнулася через те, що це одна з тих сфер, в якій активно бере участь психологія. Існує два способи за якими машина може обробляти інформацію, що надійшла з зовнішнього світу.

Перший подібний до дії простих рефлексів. Тобто з усього каналу інформації витягається частина, що відразу надсилається на відповідні її модальності аферентні структури або спочатку поєднується з іншою інформацією. Машини, що працюють за такою схемою досить швидко реагують на зовнішні подразники і у відповідь певним чином змінюють свою програму дій.

Альтернатива цьому підходу – підхід модельний. Тобто стимули, що надійшли ззовні спочатку конструюють модель зовнішнього світу. При цьому робота починається функції. Що відображає стан світу W на окремі стимули S. Ця функція S = f (W) добре відома і вирішується в області комп’ютерної графіки. Робота ж комп’ютерного бачення прямо протилежна до завдання комп’ютерної графіки, тобто ми повинні обрахувати W через S. Але в цьому і полягає проблема, бо з картини світу ми не в змозі відновити всі аспекти його існування. Інша проблема цього методу полягає у надмірності задач, поставлених перед програмою. Щоб вирахувати функцію f у комп’ютерній графіці для 1 кадру може знадобитися біля кількох годин, а для вирахування оборотної функції – ще більше. До того ж, на відміну від промальовування комп”ютерної графіки, штучному інтелекту для виконання його завдань рідко коли потрібна настільки детальна картина світу.

Формування зображення

Світло, що розсіюється предметами на «сцені» концентрується у процесі зору і утворює двовимірне зображення. Площина, на якій утворюється зображення, покрита фото чутливими елементами, наприклад фоторецепторами, галогенами срібла або елементи з зарядовим зв’язком (Charge-Coupled Device —

CCD). На початкових етапах розпізнання візуальних об’єктів комп’ютер проходить через ряд елементарних функцій, для того, щоб потім перейти до більш складного аналогу зображення. Це відповідає сенсорним процесам і процесам елементарної обробки візуальної інформації у зоровому аналізаторі людини.

Сенсорні процеси

Світло

Програма розпізнавання об’єктів починає з обробки яскравості пікселів отриманого на площині зображення. Яскравість залежить від кількості фотонів, направлених на фото чутливий елемент з деякої точки сцени, де інтенсивність переводиться в відносні одиниці, розмах яких тим більший, чим більше бажане розширення і точність результату. Кількість світла (фотонів) залежить від багатьох факторів, таких як вид відбиваючої поверхні і інші елементи сцени, що також можуть розсіювати світло. Існує кілька видів поверхонь, більшість реальних матеріалів поєднують у собі розсіювальні і поглинаючі характеристики. Саме моделювання таких об’єктів є головною задачею комп’ютерної графіки, метод полягає в імітуванні фізичного джерела світла і подальшого багаторазового відбивання променю.

Колір

Колір у фізичному сенсі програмується комбінацією хвиль деяких частот. Чистими, одно частотними, кольорами є тільки сім, що входять у веселку. Але це не означає, що для створення кольорового зображення необхідно оперувати всіма сімома, експерименти, розпочаті ще Томасом Юнгом доводять, що для створення будь-якого кольору, принаймні такого, що може сприйматися людиною, достатньо оперувати трьома довжинами хвиль: червоний – 700 нм, зелений – 546 нм, синій – 436 нм. Правильність такого підходу підтверджує людська зорова система, що складається з трьох видів колбочок.

Перший етап обробки зображення

Перший етап обробки зображення полягає у підготовці зображення до розпізнавання, тут прибирається шум (згладжування) на зображення і розпізнаються його контурів, сегментація. Ці операції проводяться локально, тобто для окремої групи пікселів, не зважаючи на все зображення, для їх виконання немає потреби у розумінні який саме об’єкт зображено. Саме тому такі початкові операції можуть проводитися паралельно. Операція згладжування проводиться на основі обрахування значення яскравості пікселя на основі значень яскравості його елементів. Як значення яскравості береться середнє значення яскравості сусідніх пік селів, а для визначення кількості таких пік селів, що слід взяти для обрахунку існує спеціальна формула гауса. Наступною операцією є віднаходження країв, тобто ліній розділювачами для областей зі значною різницею в яскравості. Контури зазвичай відповідають важливим об’єктам на сцені. Така операція необхідна для зняття перенасиченості і перевантаження деталями картини, перетворення її у більш абстраговану, узагальнену. Контури відносяться тільки до такої, окремо взятої експозиції і тому не можуть дати визначення об’єктам, що на ній знаходяться. Але вони допомагають в цьому у ході подальшої обробки зображення. Краї, що утворюються не є точними. Деякі окремі частини, що на сцені утворюють одну лінію, не з’єднуються у цілісність на отриманому зображення. Деякі з країв утворені шумом і не несуть смислового навантаження. Це пояснює необхідність проведення попереднього прибирання шуму, бо шумові пік селі створюють додаткові пікові точки, що призводить до виникнення шумових контурів. На малюнку зображено зниження інтенсивності шумових пікових точок х2 і х3 і константність істинної пікової точки х1.

а) Попіксельна діаграма зображення до згладжування

б) Попіксельна діаграма після згладжування

Після такої обробки слід об’єднати окремі пік селі країв у власне краї. Для цього користуються допущенням, що будь-які пік селі, що знаходяться поруч і мають однакову орієнтацію складають одну лінію краю.

Так як машинне сприйняття побудоване на реалізації загальних принципів сприйняття людини, то наступною операцією стає та, що призводить до утворення конгруентного образу, адже мозок людини не сприймає навколишній світ як набір точок, а виділяє з нього деякі цілісні об’єкти. Як і мозок людини (мова іде про першоразове сприйняття деякого предмету чи явища, а не послідуюче його сприйняття, де багато залежить від попереднього досвіду і його узагальнення), машина розбиває цілісно сприйняту картину світу на групи. Розбиття проходить на основі врахування особливостей характеристик пікселів, адже можна допустити, що у межах одного об’єкта вони змінюються мало. Але таке розбиття, що базується на елементарних і низькорівневих знаннях про зображення часто може призвести до помилок і хибних результатів. Для уточнення слід використовувати високо рівневі знання про те, які саме предмети можуть зустрітися вданій схемі.

Другий етап обробки інформації, витягання трьохвимірного зображення.

Мета сприйняття і обробки візуальної інформації – взаємодія з оточуючим світом. Сцена навколишнього середовища є тривимірною, а тому для успішної взаємодії з нею машині необхідні знання не про двовимірне зображення, а про тривимірну модель. Для переводу зображення у модель необхідно завершити процес розпізнавання об’єктів, який було розпочато на елементарному рівні. Після цього, витягаючи інформацію як з даної картини, так і з деяких узагальнених відомостей про об’єкт машини, подібно до людини, може побудувати цілісний, конгруентний образ предмету.

Для початку слід завершити процедуру сегментації, розпочату ще на елементарному рівні. Також в розпізнавання образу входить визначення орієнтації і позиції образу відносно суб’єкта сприймання, визначення його форми. Це, власне і є витягненням тривимірної інформації з зображення. Орієнтація і позиція об’єкта є однією з найважливіших елементів інформації, так як дозволяє орієнтуватися у просторі. При зміні положення предмету відносно камери, незмінною лишається лише форма предмету, тобто форма грає роль у зберіганні, деякою мірою, константності упізнавання предмету при зміні його положення у тривимірному просторі. Але найбільш вагомою функцією форми є розпізнавання об’єкту з можливістю його подальшої класифікації.

Тепер постає питання, як же дістати інформацію про третій вимір з початкового зображення. Для цього у людській зоровій системі передбачено багато можливостей, які можна класифікувати за загальним принципом дії: бінокулярні і монокулярні.

Ось приклад такої класифікації за Величковським:

Ознаки глибини

Бінокулярність/ монокулярність

Абсолютність/ відносність

Якісність/ кількісність

Бінокулярний паралакс

Б.

В.

К.

Вергентні рухи очей (до 3 м)

Б.

А.

К.

Акомодація хришталика (до 2 м)

М.

А.

К.

Монокулярний параллакс (руховий)

М.

А./В.

К.

Перекриття поверхонь, текстур

М.

В.

Я.

Градієнти величин, густини

М.

А./В.

К.

Знання розмірів, віддаленності

М.

А.

К.

Висота положення у полі зору

М.

В.

К.

Розмирість контурів, колір

М.

В.

К.

Розподіл світла і тіні

М.

В.

Я./К.

Розділення на фігуру і фон

М.

В.

Я.

Тепер можна розглянути за допомогою яких ознак машина будує третій вимір. Кожна з них має деякі недоліки, а в сумі всі разом дають досить точну картину сцени.

Рух

Відеокамери дозволяють отримувати до кількох десятків кадрів за секунду і різниця між кадрами може стати вагомим джерелом інформації про третій вимір сцени, така послідовна у часі зміна у зображенні одного об’єкту називається оптичним потоком. З нього витягуються дані, за якими будується модель, такими даними можуть стати напрям вектору руху, швидкість зміни зображення, прискорення зміни зображення, тощо.

Бінокулярні стерео дані.

Якщо машина створена за подобою людини, то має отримати від свого творця і дуже важливу деталь – бінокулярний зір. Бінокулярна побудова тривимірного зображення побудована на принципі, що ми розглянули вище. Тільки діставання кількох зображень досягається не за рахунок руху, а за рахунок сприймання одночасно двох різних зображень. Різниця між ними полягає у зсуну тості одне відносно одного, а отже після співставлення двох зображень буде ідентифікована неузгодженість. Третій вимір відновлюється на основі аналізу дивергенції осей зору і неузгодженості зображень, вираховуючи відстань до об’єкта за геометричними правилами.

Градієнти текстури

Під текстурою у повсякденному житті розуміється властивості об’єктів, пов’язані з тактильними відчуттями, що вони викликають. А у проблемі зорового сприйняття простору – наявність малюнку, що повторюється на поверхні і який може бути віднайдений візуально. Також до текстури відноситься і поняття густоти – частоти розташування елементів малюнку текстури, текстелів. Існує дві причини, через які однаковість малюнку може викривлюватись: різні відстані між камерою і текстелами; різні ракурси на тек стели. За допомогою математичного аналізу можна створити градієнти текстури, тобто показники швидкості зміни різних характеристик текстелів. Для відтворення даних про форму машини виконують двофазне завдання

    1. вимір градієнтів текстур

    2. оцінка значень можливих змін форми і положення, що могли б призвести до такої зміни текстури

Затінення

Затінення – зміна інтенсивності світла, визначається геометричною

будовою сцени і характеристиками поверхонь. Задачу по відтворенню характеристик сцени за яскравістю пік селів майже неможливо розв’язати і такий спосіб обрахунку третього виміру застосовний тільки в найпростіших випадках. До складнощів призводить велика кількість взаємо відбивань променів при наявності великої кількості предметів з різними, невідомими коефіцієнтами заломлення. Безсумнівно, люди здатні до такого типу аналізу навколишнього світу, тому вказана проблема є одним з напрямків для подальшого вивчення.

Контури

Контурний малюнок може дати нам велику кількість інформації про взаємо розташування предметів на ньому, нахилі і попороті поверхонь. Таке відчуття може досягатися завдяки поєднанню знань вищого рівня (досвіду) зі знаннями нижчого (ситуативними). Всі лінії на малюнку можуть приймати багато значень, і важливою задачею постає розмітка їх, тобто оцінка значення кожної з них. Саме ця задача була однією з найперших, що вивчалася у розділі машинного зору. Кожну лінію можна віднести до проекції лімба (сукупність точок, що ми бачимо там, де лінія зору походить по дотичній до поверхні) чи краю (звичайна лінія). При цьому краї діляться на вгнуті, опуклі чи закриваючі (ті, що закривають те, що знаходиться за ними). Кожній лінії можна присвоїти символ, що буде позначати її вид, такий символ називають міткою. На прикладі тригранних об’єктів Хаффмен і Клоувс незалежно один від одного створили повний перелік всіх можливих групувань цих видів контурів. При використанні цього словника об’єднань при аналізі контурного малюнка необхідно вирішувати задачу визначення того, які поєднання є співставні. Для цього існує правило, за яким кожній лінії можна присвоїти тільки одну мітку.

Розпізнавання об’єктів.

У людській свідомості усі об’єкти класифіковані. Ця класифікація випрацьовується протягом усього життя і відрізняється високим ступенем узагальненості. В області штучного інтелекту здатність розпізнавати предмети прийнято називати розпізнаванням об’єктів. До цього відноситься як розпізнавання класів об’єктів (собака) так і одиничних об’єктів (мій собака Рекс). Люди можуть розпізнавати не тільки об’єкти, але і види діяльності, наприклад посмішку, біг, писання, тощо, але для машин розпізнавання такого високого рівня знаходиться ще у стадії розробки. Складності викликає навіть елементарне розпізнавання об’єктів, адже машина має робити це незалежно від освітлення, оточення, положення, умов бачення.

Насамперед постає проблема сегментації об’єктів. Існує два способу детектування об’єкту. «знизу-вверх» і «зверху-вниз». Перший з них може призводити до багатьох помилок, але є на багато простішим для обрахунку. Віг полягає у розбитті об’єктів на сегменти і аналіз сегментів. Другий спосіб, що зазвичай використовується у всіх системах, вимагає складних обрахунків, адже полягає у пошуку необхідного об’єкта на площині всього зображення. На даний момент перспектива вбачається у розвитку і покращенні першого методу.

Іншою задачею є розпізнавання об’єкту незалежно від модифікацій його форми чи положення. Слід зазначити, що зміни між об’єктами всередині класу і через модифікації станів носять різний характер. Одним з варіантів розв’язання цієї проблеми є зведення об’єктів до початково заданого стану, але для цього необхідно задати всі об’єкти.

Існує два підходи до розпізнавання об’єктів: розпізнавання з врахуванням яскравості і розпізнавання з врахуванням характеристик. При обранні першого методу за основу береться пошук області пікселів, що відповідає шуканому об’єкту і обробка цієї області. Цей спосіб ґрунтується на аналізі необроблених зображень. Другий метод навпаки, використовує вже сегментовані зображення. Це допомагає досягнути скорочення часу детектування образу і досягнення інваріантності освітлення.

Цікавою задачею також постає оцінка пози, тобто позиції і орієнтації, об’єкту. Це відіграє велику роль при необхідності маніпулювання предметами. Задача вирішується досить просто і визначено, для цього використовується метод вирівнювання. В його основу покладено порівняння контурів проекції тривимірної моделі при її трансформації і двовимірного зображення.

Комп’ютерна мова

Одна із важливих задач, що стоїть перед сучасними комп”ютерами – розпізнавання і генерація поми. Мова – домінуюча форма спілкування у людей. Розпізнавання мови можна інтерпретувати як власне розпізнавання порядку слів, що було сказано або ж як ідентифікацію смислу фрагментів мовлення. Мова – доже складна система, для комп’ютерів особливо складним виявляється велика її зашумленість під зашумленістю мови можна розуміти як звичайні фізичні шуми, так і нескінченну кількість варіантів вимови. Саме це підштовхнуло вчених до думки, що розпізнання мови має будуватися на імовірнісній основі. Основні моделі, що використовуються у розпізнавачах мови зазвичай дуже прості. Наприклад модель двослівних поєднань вираховує вірогідність використання одного слова, в залежності від іншого. Таке обрахування необхідне при появі у словосполученні омофонів. В основі розпізнавання мови лежить те, що у всіх мовах використовується в основному досить обмежений і однаковий набір фонем (40-50). Але є і такі, що використовуються тільки в окремих мовах.

Звуки мови

Сприйняття звуків для машини проходить з допомогою мікрофону і аналогово-цифрового перетворювача, що виміряє величину струму, у який мікрофон перетворив коливання мембрани. Для обробки мови зазвичай використовуються частоти від 8 до 16 кГц. Хоча звукові частоти мови і досягають таких високих значень, але зміна змісту сигналу проходить набагато рідше, приблизно 100 Гц. Через це, для зменшення об’єму опрацювання інформації, при аналізі використовують більші проміжки часу, фрейми (~ 10 мс). У межах кожного фрейму його характеристики задаються векторами.

  1. частотний ряд деякого звуку.

  2. Оброблений сигнал

  3. Фрейми з виділеними характеристиками (3)

У реальних системах використовуються сотні таких характеристик фреймів, але все ж. очевидно, що при такій обробці деяка частина інформації втрачається. Задача обробки звукової інформації полягає у тому, щоб, знищивши усі шуми на кшталт гучності, швидкості промови, тощо, вичленувати центральні характеристики, що є основними для даного звуку. Допомагає у цьому також класифікація фонем за їх складом. Наприклад якщо подібним образом описувати букву «т», то можна сказати, що вона складається з трьох станів: тихий початок, невеликий вибух (звільнення повітря) в середині і, як правило, шипіння у кінці.

Логічні системи в мові

Для того, щоб підтримувати розмови з людьми необхідно вміти розпізнавати зли тну мову, а не тільки окремі її елементи.. але насправді, зв’язна мова це не просто послідовність її елементів. І послідовність найбільш імовірних слів не є найбільш імовірною послідовністю слів. Отже, вирахувавши найбільш імовірні слова за використанням фонем, машина не може точно визначити речення в цілому, адже використання слів значно змінюється в залежності від того, в оточенні яких слів воно знаходиться і на якій позиції. Інша проблема – проблема сегментації, тобто розрізнення кінця одного слова і початку іншого, адже зазвичай у повсякденному мовленні у реченні між словами немає пауз. Як і більшість проблем у розпізнанні мови, ця задача вирішується на базі імовірнісних обрахунків.

Розуміння мови

Розробка способів розуміння природного мовлення є одним з найперспективніших і найнеобхідніших напрямків розвитку галузі штучного інтелекту. Цей напрям базується на методах логічного та імовірнісного пред’явлення знань і формуванні роздумів. На відміну від інших областей штучного інтелекту, саме ця потребує детального дослідження поведінки людей, адже мова – засіб комунікації, притаманний тільки їм і у великій мірі відображає людську психологію. Люди посилаюсь інформацію, закодовану у мові, з метою досягнення деяких цілей, мовленнєві акти є нічим іншим, як спробою примусити інших суб’єктів зреагувати певним чином. Мова – єдина в своєму роді знакова система, що використовує граматику для генерації структурованих повідомлень, що характеризуються необмеженою різновидністю. Усі варіанти використання мови є ситуативними, тобто смисл фрагменту мовлення залежить від ситуації, в якій був створений.

Для покращення розуміння граматичних схем, машини можуть використовувати розширення граматики, тобто граматику визначених висловлювань (Definite Clause Grammar— DCG). Важливою проблемою при розумінні природної мови є її неоднозначність. Більшість висловлювань може приймати декілька значень, вірне з яких, на даний момент, лише одне. Відкинення неоднозначності виконується на основі знань про світ і сучасну ситуацію у ньому.

Не дивлячись на те, що такі сучасні системи генерування мови як Parry? NET talk та інші досить добре можуть імітувати природній діалог з людиною, вони, все ж, не можуть обманювати співрозмовника дуже довго. Їх проблема полягає не у пам’яті, не у здатності генерувати вагомі речення, а у недостатньому розумінні машинами мови, що вони використовують. Комп’ютерний аналіз складних взаємовідносин у середині мови призвів до створення досить складних програм, що здатні розуміти мову. Прекрасним прикладом для цього може слугувати перекладач Google.



Загрузить файл

Похожие страницы:

  1. Загальні аспекти розробки систем зі штучним інтелектом

    Реферат >> Информатика
    ... і функції людини. Створення систем штучного інтелекту (ШІ) — це багатоаспектне дослідження ... навчання як навчальну систему. Проблема пояснень та обгрунтування правильності ... не можуть самі навчитися. • Є проблеми продуктивності щодо тривалості відповіді в ...
  2. Слухові апарати зі штучним інтелектом

    Реферат >> Астрономия
    Слухові апарати зі штучним інтелектом Від втрати слуху страждає чимало людей. ... налагодження, але не вирішило проблеми наявності власного шуму аналогового пі ... апарат Adapto, в якому закладено принципи штучного інтелекту. Однією з найбільших проблем ...
  3. Проблема споживання людством благ цивілізації

    Реферат >> Социология
    ... використання природних ресурсів. Проблема перенаселеності Завжди перед ... також створення штучного інтелекту й автономної від людини техніки, керованої штучним інтелектом. Жити ... і зараз. Література 1. Бубер М. Проблеми людини. - К., 1999 2. Парсонс Т. ...
  4. Прогностичні дослідження маїбутнього

    Курсовая работа >> Философия
    ... каналів сприйняття, а це вже рішення проблеми штучного інтелекту. Штучний інтелект Із розповіді керівника лабораторією кл ... застосовувалося устаткування, постачене керуючими модулями штучного інтелекту. Очевидно, що створення і впровадження под ...
  5. Філософські проблеми техніки

    Реферат >> Философия
    ... штучного інтелекту, остільки створення самого штучного інтелекту стає другорядним завданням. Отже, сама постановка проблеми ... про наслідки ство­рення штучного інтелекту ...

Хочу больше похожих работ...

Generated in 0.001166820526123