ФӘН ҺӘМ ҒАЛИМДАР
13 Мая 2024, 10:00

Башҡорт телен үҫтереүҙә ғәмәли эш

Былтыр Рәсәй Фәндәр академияһы Өфө федераль тикшеренеүҙәр үҙәге Тарих, тел һәм әҙәбиәт институтының ғилми коллективы Башҡортостандың фән һәм техника өлкәһендә дәүләт премияһына лайыҡ булды. «Башҡорт теленең машина фонды мәғлүмәт системаһы» фәнни-тикшеренеү проектының авторҙары: Зиннур Сиразитдинов, Лилиә Боҫҡонбаева, Анита Ишмөхәмәтова, Гөлгөнә Шәмсетдинова.Юғары кимәлдә баһаланған эште коллектив ике тиҫтә йылға яҡын алып бара. Был проект – башҡорт телен һаҡлау һәм үҫтереү өсөн башҡарылған ғәмәли эштәрҙең береһе. Машина фондында ҙур күләмдәге мәғлүмәт, дидактик материалдар тупланған, ә уның эҙләү системаһы яңы лингвистик тикшеренеүҙәрҙе тиҙләтергә мөмкинлек бирә. Рәсәй халыҡтары телдәрендә бындай фонд, руссаны иҫәпләмәгәндә, башҡорттарҙа ғына бар.Проекттың мөмкинлектәре, тарихы һәм киләсәге хаҡында уның авторҙары менән әңгәмә ҡорҙоҡ.

Башҡорт телен үҫтереүҙә ғәмәли эшБашҡорт телен үҫтереүҙә ғәмәли эш
Башҡорт телен үҫтереүҙә ғәмәли эш

Һанлы технологиялар – заман талабы

– Машина фонды, һис шик­һеҙ, хәҙерге һанлы технологиялар заманында башҡорт телен үҫтереү һәм һаҡлау маҡсатында башҡарылған бик мөһим сара. Һеҙ тормошҡа ашырған проекттың дәүләт кимәлендә танылыу яулауын был мәсьәләнең әһәмиәтен билдәләү тип аңлайбыҙ.

Лилиә Боҫҡонбаева:
– Эйе, бөгөн барлыҡ өлкәләрҙә лә, шул иҫәптән тел өлкәһендә лә, цифрлаштырыу эше бара, шуға күрә был заман талабы тип әйтергә кәрәк, сөнки ошо процестан тороп ҡалһаҡ, телебеҙҙең киләсәге бик хәүефле булыр. Беҙҙең институтта ла был йүнәлештә күп кенә эштәр башҡарыла. Милли телебеҙҙә һаҡланған, телебеҙгә ҡағылышлы булған һәр мәғлүмәт электрон вариантта булып, интернет селтәре аша бөтә донъяға асыҡ булырға тейеш тигән маҡсатта Башҡорт теленең машина фонды булдырылды. Фонд, телселәр, уҡытыусылар, студенттар һәм мәктәп уҡыусылары өсөн башҡорт теле буйынса мәғлүмәт эҙләү системаһы булараҡ, бик күп һәм бай материал туплаған.

– Башҡорт теленең машина фонды күп йыллыҡ хеҙмәтегеҙҙең һөҙөмтәһе. Эш барышы хаҡында беҙҙең журналда ла мәҡәләләрегеҙ баҫылып сыҡты. Проектҡа нигеҙ һалыныу һәм артабанғы мөһим, хәл иткес ваҡиғаларҙы иҫкә тө­шөргәндә, эште ниндәй этаптарға бүлергә була?

Анита Ишмөхәмәтова:
– 1993 йылда Зиннур Әмир улы Сиразитдинов Өфө ғилми үҙә­генең президиумында Башҡорт те­ленең машина фондының концеп­цияһы тураһында сығыш яһай. 2002 йылда «Башҡортостан ха­лыҡтары телдәрен һаҡлау, өйрәнеү һәм үҫтереү» дәүләт программа­һының «Башҡорт теле һанлы техно­логияларҙа» бүлеген тормошҡа ашырыу маҡсатында институттың Тел бүлегендә Лингвистика һәм мәғлүмәт технологиялары лабора­торияһы булдырыла. Ошо ваҡыттан проект өҫтөндә эҙмә-эҙлекле эш башлана.
2003 йылда лаборатория хеҙ­мәткәрҙәре тарафынан физика-математика фәндәре кандидаты Владимир Иванович Луцен­ко менән берлектә Машина фондының пилот проекты эшләнә. Шул проект бу­йынса тәүҙә фонд институт компь­ютерҙары өсөн генә тәғәйенләнә. Артабан уны корпоратив селтәр рәүешендә, йәғни беҙҙең институт ғалимдары, Башҡорт дәүләт университеты, Башҡорт дәүләт педагогия институты уҡытыусылары өсөн эшләргә тигән фекер тыуа. 2006 йылдан алып фондты интернетта барлыҡ ҡулланыусылар өсөн асыҡ система рәүешендә эшләргә тигән ҡарар ҡабул ителде. Программалау эшендә Анатолий Ильич Полянин ҙур ярҙам күрһәтте.
2007–2012 йылдарҙа беҙҙең коллектив Башҡорт теленең машина фондына ингән ете мәғлүмәт базаһын тулыландырҙы. 2013 йылдан проза, публицистика, фольклор текстарын үҙ эсенә алған корпус проекттары менән шөғөлләндек. 2017–2021 йылдарҙа «Башҡорт теленең диалект текстары корпу­сын булдырыу» исемле тема сиктәрендә, Ҡыҙыл, Әй, Учалы
һөйләштәренән йыйылған 765 аудиояҙманы транскрипциялап, базаға индерҙек. 2023 йылда башҡорт телендә киң мәғлүмәт са­раларының һөйләү корпусын төҙөү өҫтөндә эш башланды.
– Хәҙерге көндә фондтың күлә­ме ниндәй, ул ниндәй бүлектәрҙән тора?

Лилиә Боҫҡонбаева:
– Башҡорт теленең машина фонды – ул мәғлүмәт эҙләү системаһы, автоном мәғлүмәт базалары менән эшләгән махсуслаштырылған сис­темаларҙы үҙ эсенә ала. Уны Интернет селтәрендә https://mfbl2.ru адресы буйынса табырға мөмкин. Бөгөнгө көндә фонд ун ҙур бүлектән тора: дөйөм картотека, лексикографик, эксперименталь-фонетик, грамматик, диалектологик базалар, ҡулъяҙма һәм иҫке баҫма китаптар каталогтары базалары, проза, публицистик һәм фольклор әҫәрҙәре текстарын үҙ эсенә алған корпус базалары. Лингвистик мәғлүмәттәр базаларының дөйөм һаны – 75 берәмек.
Мәҫәлән, лексикография база­һы, башҡорт теленең ғәмәлдәге автор һүҙлектәренән сығып, һүҙ ту­раһында мәғлүмәт бирә. Бүлеккә 58 һүҙлек индерелгән, һүҙлек мәҡә­ләләренең дөйөм күләме – 400 мең берәмек. Базала академик һәм уҡыу һүҙлектәре: бер һәм ике телле, йышлыҡ, терминологик, фразеологик, синонимдар һүҙлектәре; һүҙлек-белешмәләр: торлаҡ пункт­тар, ҡала урамдары исемдәре, Башҡортостандың һыу һәм тау объекттары атамалары һүҙлектәре һәм башҡалар бирелгән.
Грамматик базаға гипертекст форматында бирелгән башҡорт теленең академик грамматикаһы –1981 йылда Мәскәү ҡалаһында донъя күргән «Грамматика современного башкирского литературного языка» баҫмаһы, исемдәр һәм ҡылымдар буйынса квантитатив морфологик базалар индерелгән.
Машина фондында башҡорт теленең корпус проекттары ла урын алған. Проза корпусы башҡорт яҙыусыларының 1920 йылдар аҙа­ғынан алып хәҙерге ваҡытҡа тик­лем баҫылған текстарын үҙ эсенә ала. Корпустың дөйөм күләме – 30 миллион һүҙ ҡулланыш. Публицистик корпусҡа һуңғы йылдарҙа нәшер ителгән башҡорт гәзит-журналдарынан алынған текстар инә. Әлеге көндә корпустың дөйөм күләме – 12729949 һүҙҡулланыш. Фольклор корпусының мәғлүмәт базаһы башҡорт халыҡ ауыҙ-тел ижадынан 17951 тексты үҙ эсенә ала. Базаға эпик әҫәрҙәр, әкиәт текстары, мәҡәлдәр, әйтемдәр, йо­маҡтар, ышаныуҙар һәм башҡа ҡомартҡылар индерелгән. Базаның дөйөм күләме 855876 һүҙҡулланыш тәшкил итә.

– Системаның мөмкинлектәре менән күберәк кемдәр ҡуллана икән? Шуны анализлау буйынса ниндәйҙер күҙәтеүҙәр, статистика алып барыламы?

Анита Ишмөхәмәтова:
– Башҡорт теленең машина фонды фән менән шөғөлләнеүселәргә, һүҙлек төҙөүселәргә, вуз уҡытыу­сыларына, студенттарға, мәктәп уҡытыусыларына һәм уҡыусылары­на, аспиранттарға, ғөмүмән, баш­ҡорт теле менән ҡыҙыҡһыныусы­ларҙың барыһына ла тәғәйенләнә.
Беҙҙең өсөн фондҡа кем, ҡайһы төбәктән, ҡасан ингәне һәм күберәк ниндәй бүлектәргә мөрәжәғәт итеүе мөһим. Бындай статистиканы алып барыу өсөн махсус бүлек булды­рылған. Ҡулланыусылар күбеһенсә лексикография бүлегенән һүҙҙәрҙең тәржемәһен эҙләй. Шулай уҡ диалекттар менән дә ҡыҙыҡһыныусылар күп. Рәсәй буйынса иң күп кереүселәр – Мәскәү ҡалаһынан, уға етә – Түбәнге Новгород. Сит илдәрҙән – Норвегия, Голландия.

– Был күләмле, ҡатмарлы хеҙ­мәтте атҡарып сығыу еңел генә бирелмәгәндер. Эш барышында ниндәй ҡыйынлыҡтар булды?

Зиннур Сиразитдинов:
– Фәнни эштә барлыҡҡа килгән ҡыйынлыҡтар күпселек осраҡта финанстарға бәйле була. Беҙҙең эштә лә шулай булды. Әйтеп китә­йем, Лингвистика һәм мәғлүмәт технологиялары лабораторияһы 2000–2005 йылдарҙа ҡабул ителгән «Башҡортостан Республикаһы халыҡтары телдәрен һаҡлау, өйрәнеү һәм үҫтереү» дәүләт программаһына ярашлы барлыҡҡа килде. Йәғни шул программаның «Башҡорт теле информацион технологияларҙа» тигән, фәнни-тикшеренеү лаборатория ойоштороуға ҡағылышлы 5.2 пункты нигеҙендә. Был дәүләт программаһы 2006–2010, 2012–2016, 2019–2024 йылдарҙа арта­бан дауам ителде, әммә 2012 йылдан алып программаны финанслау туҡтатылды. Бары тик Башҡортос­тан Фәндәр академияһы тарафынан билдәләнгән аҙ күләмле өс грант ҡына алдыҡ. Ә лабораторияла ете кеше эшләй ине. Ярай әле федераль гранттар – Рәсәй гуманитар ғилми фонды, Рәсәй фундаменталь тикшеренеүҙәр фондының гранттары булды. Хәйер, уларҙың да күләме ҙур түгел ине. Шул уҡ ваҡытта грант аҡсаһы йылдың аҙағына ғына килә ине. Ә лаборатория хеҙмәткәрҙәре башҡа бер урында ла эшләмәй, уларҙың ғаиләһе бар, ҡайһы бер­ҙәре күп балалы. Бик ауыр булды. Ҡайһы берәүҙәр эштән китте, ләкин бына беҙ дүртебеҙ ҡалдыҡ. Телебеҙгә, халҡыбыҙға хеҙмәт итеү теләге көслө ине. Ә шул уҡ ваҡытта Сыктывкарҙа, Элистала, Ҡазанда коллегаларыбыҙ бюджетта ине. Шул йылдарҙа Татарстанда эшләп килгән лабора­тория киңәйеп институтҡа әйләнде, ундағы хеҙмәткәрҙәр бюджет ставкаларында эшләп, шундай уҡ дәүләт программаларында ла ҡатнашып, өҫтәмә рәүештә аҡса алды. Ҡыҙғанысҡа ҡаршы, минең Башҡортостан Фәндәр ака­демияһына, ул ваҡыттағы респуб­лика етәксеһе Р.Хәмитовҡа мөрәжә­ғәттәрем яуапһыҙ ҡалды. Инде беҙҙең институтҡа Зөһрә Йыһанур ҡыҙы Рәхмәтуллина директор булып тәғәйенләнгәс кенә хәлдәр үҙгәрҙе – хеҙмәткәрҙәр институт штатына тулы ставкаларға алынды.


Телебеҙ байлығы сикһеҙ

– Башҡорт теленең машина фондын булдырыуҙан тыш, һеҙ тағы ла ниндәй проекттар башҡа­раһығыҙ, ниндәй фәнни темалар өҫтөндә эшләйһегеҙ?

Лилиә Боҫҡонбаева:
– Бында башҡорт теленең Терминологик базаһын әйтеп китергә кәрәк. Был базаны интернет сел­тәрендә http://bashterm.ru/ адресы буйынса табырға мөмкин.
Ғәмәли лексикографияла эш­тең ҙур өлөшөн терминологик һүҙ­лектәр төҙөү тәшкил итә. Был эштә лексикографтарға махсус терминологик мәғлүмәт базалары ҙур ярҙам күрһәтә. Улар бындай төрҙәге һүҙлектәр төҙөүҙе автоматлаштырып ҡына ҡалмай, ә терминдар картотекаһын булдырыу, уны тулыландырыу кеүек процестарҙы ла үҙ эсенә ала. Башҡорт тел ғилемендә терминологик һүҙлектәр күп тө­ҙөлгән. Һуңғы 20–25 йыл эсен­дә генә фән, техника, сәнәғәт һәм ауыл хужалығының төрлө өлкә­ләренә ҡараған егерменән ашыу һүҙлек баҫылып сыҡҡан. Әммә башҡорт терминологияһы буйын­са мәғлүмәт базаһы булмауы был йүнәлештәге эште ниндәйҙер кимәлдә тотҡарлай ине. Мәғлүмәт банкын төҙөү 2012 йылда башлана, гуманитар һәм тәбиғи фәндәр, төрлө хужалыҡ тармаҡтары буйын­са ике телле – русса-башҡортса һәм башҡортса-русса терминология буйынса бүлектәр булдырылды.
Мәғлүмәт банкының базаларына теркәүҙең төп элементы – терминологик һүҙ. Уның бөтә варианттары ла, йәғни орфографик, һүҙ яһаусы һәм лексик-синтаксик варианттары теркәлә. Терминологик база элементтары ул ябай һәм составлы һүҙҙәр, мәҫәлән, архитектоника – баш мейеһе ҡабығы архитектоникаһы, шулай уҡ терминдарҙың ҡыҫҡа һәм тулы варианттары, мәҫәлән, юғары уҡыу йорто – вуз, электрокардиограмма – ЭКГ.
Мәғлүмәт базаларында термин башҡортса һәм рус теленә тәр­жемәлә бирелә, ниндәй һүҙ төр­көмөнә ҡарағанлығы, әгәр бул­һа, – омонимияһы, ҡулланыу нормаһы билдәләп үтелә, йәғни стандартлаштырылғанмы ул, тәҡдим ителгәнме, рөхсәт ителгәнме. Шулай уҡ терминдың төҙөлөшө күрһәтелә, йәғни термин ябай һүҙҙән торамы әллә ҡушма һүҙҙәнме һәм башҡалар.
Әлеге көндә рус һәм башҡорт теле терминдарының дөйөм күләме 200 меңдән ашыу берәмек тәшкил иткән терминологик базалар төҙөлгән. Терминды уңайлы эҙләү системаһы һәм бөтә ҡылыҡһырламаларҙы билдәләү мөмкинлеген биргән программа эшләнгән.
Зиннур Сиразитдинов:
– Ваҡытында машина фондтарын төҙөүгә тиҫтәләгән ғилми конференциялар арналды, мәҡәләләр, монографиялар яҙылды. 2001 йылда рус теленең фонды буйынса – докторлыҡ диссертацияһы, 2002 йылда татар теле буйынса кандидатлыҡ диссертацияһы яҡ­ланды. Беҙ ҙә техник эш менән генә сикләнмәнек, уның теоретик мәсьәләләрен сисеп, ғилми мәҡә­ләләр яҙҙыҡ, 2013 йылда коллектив монография ла сығарҙыҡ.
Әлбиттә, беҙҙең коллективтың ғилми эше фондты төҙөү менән генә сикләнмәне. Фондты булдырған осорҙа Лилиә Айса ҡыҙы канди­датлыҡ диссертацияһын яҡланы. Анита Шәүҡәт ҡыҙы менән Гөлгөнә Ғазнауи ҡыҙы диссертацияларын
яҙып, яҡлау алдында торалар. Үҙҙә­ренең эштәре тураһында коллегаларым үҙҙәре әйтеп китһә дөрөҫ булыр.
Лилиә Боҫҡонбаева:
– Машина фондында урын алған бай фактик материал телселәрҙең иғтибарын әлегәсә тикшерелмәгән мәсьәләләргә йүнәлтергә булыш­лыҡ итә. Мәҫәлән, әлеге көндә йәнле һөйләү теле бөтөнләй тик­шерелмәгән тип әйтерлек. Был проблеманың төп сәбәбе – йәнле һөйләү теле үрнәктәре етерлек кимәлдә булмауы ине. Фондтың диалектологик бүлегендә бирелгән текстологик базаға хәҙерге көндә 800-гә яҡын текст индерелгән. Бында һүҙҙәр генә түгел, ә сегментация билдәләре, телмәрҙең паралингвистик элементтары, мәҫәлән, көлөү, ыңғырашыу, йүткереү, паузалар, хезитативтар кеүек төрлө хезитацион күренештәр бирелә. Ошо бүлек материалы нигеҙендә мин телмәрҙә барлыҡҡа килгән паузаларҙы тикшерҙем. Пау­залар телмәрҙе фразаларға һәм син­тагмаларға бүлеүсе сара ғына булып ҡалмай, ә йыш ҡына һөйләүсенең артабанғы фекерен планлаштырыуҙа билдәле бер ҡатмарлыҡтар килеп тыуған осраҡта ла барлыҡҡа килә. Буш паузалар менән бер рәттән шулай уҡ ниндәйҙер өндәр ярҙамында, мәҫәлән, э-э, ә-ә-ә, йәиһә вербаль хезитативтар ярҙамында бирелә ала. Мәҫәлән, һәр беребеҙҙең телмәрендә иң йыш осраған һүҙ ниндәй тип уйлайһығыҙ? Ул – «ни» йәки «ней». Йыш ҡына ниндәйҙер һүҙ тел осонда була, иҫкә төшмәй. Шул осраҡта һөйләүсе ул һүҙҙе аңлатып тормай, уның урынына «ни» хезитативын ҡуллана.
Шулай уҡ 2023 йылда Рәсәй фән фондының ике йылға иҫәпләнгән грантын оттоҡ. Грант өҫтөндә эш барышында һөйләү телендә күпләп осраған рус теле материалы тикшерелә. Башҡорт телендә эквиваленты булып та, телмәребеҙҙә ассимиляцияланмаған лексикаға ҡараған күп рус һүҙҙәрен ҡушып һөйләйбеҙ. Грант өҫтөндә эшләгән коллектив менән йыйған йәнле һөйләү үрнәктәре нигеҙендә был һүҙҙәрҙең прагматик функцияларын, төҙөлөшөн, тематик төркөм­дәрен тикшерәбеҙ.
Анита Ишмөхәмәтова:
– «Башҡорт теленең диалекттарында фармакофитонимдар» тигән ғилми эшемде әҙерләгәндә Машина фондына ингән материалдарҙы ҡулланып тикшереүҙәр үткәрҙем. Мәҫәлән, лексикография бүлегенә ингән һүҙлектәрҙән энәлек фарма­кофитонимының һыуһар, дунала, энәте, еҙәй, ҡамыраш булып медицина, умартасылыҡ, урман эше, ауыл хужалығы терминдары буйынса төҙөлгән ике телле һүҙлектәрҙә теркәлеүе асыҡланды һәм был ҡыуаҡтың бер нисә төрө барлығы билдәләнде: сәнскеле еҙәй, көнсығыш еҙәйе, ғәҙәттәге еҙәй, Себер еҙәйе. Диалектология базаһына мөрәжәғәт итеп, башҡорт һөйләштәрендә был һүҙҙең илленән ашыу варианты ҡулланылыуын белдек. Баш­ҡорт яҙыусылары ижад иткән әҫәрҙәр һәм шулай уҡ халыҡ ижады өлгөләренән алынған миҫалдар кәрәкле һүҙҙең ниндәй формала нисә тапҡыр ҡулланылғанын тикшергәндә файҙаланылды. Пуб­лицистика корпусынан алынған миҫалдар үҫемлектең шифалы икән­леген генә күрһәтеп ҡалмай, халыҡ медицинаһының хәҙерге көндәге әһәмиәтен иҫбатлай. Ә инде дарыу үҫемлектәренең лексикаһын тикшереү, диалекттарҙа нисек әйтелешен өйрәнеү тел тарихын өй­рәнеүселәр өсөн дә, халыҡ тарихын һәм этнографияһын өйрәнеүселәр өсөн дә берҙәй әһәмиәтле, сөнки лексиканың был ҡатламы халыҡтың мәҙәниәтен, тик шул ерлеккә генә хас үҙенсәлектәрен сағылдыра, тип уйлайым.
Гөлгөнә Шәмсетдинова:
– Минең әлеге ваҡытта эшләгән фәнни темам «Ҡуҙыйкүрпәс менән Маянһылыу» эпосына арналған. Белеүебеҙсә, был эпос төрки ха­лыҡтар араһында киң таралған, ул ҡаҙаҡтарҙа, нуғайҙарҙа, Алтай халҡында осрай. Бөгөнгө көндә эпостың варианттары Рәсәй Фәндәр академияһының Өфө федераль тикшеренеүҙәр үҙәгенең фәнни архивында һәм Өфө фән һәм технологиялар университеты башҡорт теле һәм әҙәбиәте кафедраһының фольклор фондында һаҡлана. Машина фондының фольклор корпусына был эпостың Тарих, тел һәм әҙәбиәт институтының фольклор бүлеге хеҙмәткәрҙәре тарафынан төрлө йылдарҙа экспедицияларҙа яҙып алынған ике версияһы һәм 32 варианты индерелде. Эпостың машина фондына ингән бөтә текс­тарының берләшмәһе буйынса йышлыҡ һүҙлеге төҙөлдө. Был лексикографтарға һәм стилистарға тикшеренеүҙәр өсөн ҡыҙыҡлы була­саҡ. Артабан эпостың лексикаһы, стиле, теле сағыштырма планда ҡараласаҡ.
Зиннур Сиразитдинов:
– Мин корпус төҙөү осоронда телебеҙҙең һүҙ үҙгәреше моделен барлыҡҡа килтерҙем. Ундай моделдәр морфоанализ яһаусы программалар, орфографияны автоматик рәүештә тикшереү һәм бар булған интеллектуаль системалар нигеҙендә ята.
Корпус материалдары башҡорт теленең синтаксисына яңы күҙлектән ҡарарға мөмкинлек бирә. Әлбиттә, был өлкәлә арҙаҡлы ғалимдарыбыҙ Ғәли Сәйетбатталов һәм Данис Тәкәев тарафынан телебеҙҙең синтаксисы ентекле өйрәнелгән. Ләкин фән бер урында тормай. Хәҙерге көндә синтаксисты моделләү ысулы алға сыға. Данис Солтан улы менән Ғәли Ғәли улының бай тикшеренеү материалдары нигеҙендә башҡорт синтаксик структураларының моделдәрен аныҡлау йүнәлешенә юл һалынды, ябай һөйләмдең структур-семантик моделдәре тәҡдим ителде. Әммә тел ғилемендә, әйтеп китеүемсә, яңы ҡараштар, ысулдар барлыҡҡа килеп тора. Синтаксиста шуларҙың береһе булып предикат менән облигаторлы актанттарҙан торған һөйләмдең минималь структураһын билдәләп, яңыса моделләү тора. Был ысул һөйләмдәрҙең структур һандарын кәметеп, моделдәрҙе компакт рә­үештә барлыҡҡа килтерә. Ошо йү­нәлештә беҙ башҡорт мәҡәлдәре синтаксисын тикшерә башланыҡ. Артабан бындай тикшеренеүҙәр проза һәм публицистика стилендәге текстарға ла йәйелдереләсәк. Был инде дөйөм башҡорт теле буйынса компакт рәүештәге моделдәрҙе булдырыу тигән һүҙ. Ә ул ни өсөн кәрәк, тиерһегеҙ. Синтаксик мо­делдәр текстарҙың структураһын автоматик рәүештә анализларға мөмкинлек бирә. Был инде компьютер тәржемәһен, мәғлүмәт эҙләү эштәрен камил башҡарырға мөмкинлек бирә һәм милли яһалма интеллектты төҙөү нигеҙе булып тора.

– Ҡуйған маҡсаттарығыҙға ирешеүегеҙҙе теләйбеҙ. Корпус өҫ­төндәге эште артабан ниндәй йүнә­лештә алып барырға уйлайһығыҙ?

Зиннур Сиразитдинов:
– Корпус өҫтөндәге эштә маҡ­саттар ҙур ғына. Уның күләмен 100 миллион һүҙҡулланышҡа еткерергә ине. Быны ике юҫыҡта башҡарырға ниәтләйбеҙ. Беренсенән, булған корпус проекттарының һанын арт­тырырға уйлайбыҙ. Икенсенән, яңы корпус проекттарын булдырырға фаразлайбыҙ: фәнни текстар корпусы, район гәзиттәре корпусы, башҡортса-русса текстарҙың параллель корпусы, документтар, хөкүмәт ҡарарҙарын үҙ эсенә алған рәсми ҡағыҙҙар корпусы, һөйләштәрҙең транскрипциялары һәм аудиоматериалдары корпусы. Планыбыҙҙа шулай уҡ башҡорт һөйләштәренең геоинформацион атласын булды­рыу. Был атлас, Машина фондында булған атластан айырмалы рәүештә, карталарҙа һөйләш үҙенсәлектәрен динамик рәүештә булдыра, йәғни ҡулланыусы ниндәй һөйләш үҙен­сәлектәрен күрһәтһә, шуларға ярашлы изоглоссалы карталар барлыҡҡа килтерелә. Әлеге көндә карталар статик, улар ғалимдар тарафынан билдәләнгән изоглоссаларҙан торған карталар ғына, шунлыҡтан уларҙың һаны ла сикле.
Быйылдан тел буйынса 2024–2030 йылдарға яңы программа эш­ләй башларға тейеш, уның буйынса беҙ байтаҡ эштәр башҡарырға уйлайбыҙ. Беләһегеҙме, мәғлүмәт технологиялары өлкәһендә үҙгә­рештәр үтә тиҙ була. Ниндәйҙер программа, мәғлүмәт системаһы эшләнеп сыҡҡас, ул өс-дүрт йыл эсендә иҫкерә, яңыртырға кәрәк. Быны ребилдинг тигән термин менән атайҙар. Мәҫәлән, Windows, MS Office, Photoshop һәм башҡа программалар бик тиҙ яңырып тора, яңы версиялары сыға. Шул уҡ рус, татар телдәренең милли корпустары бер нисә тапҡыр ребилдинг үтте. Ә беҙҙең машина фондыбыҙ инде 18 йыл бер үк интерфейста, бер үк функционалда йәшәп килә, бары тик күләме генә арта. Быйыл ребилдинг үткәрһәк тип өмөтләнәм. Минең арманым – корпус проекттарының күләмен ҡырҡа арттырыу һәм уларҙың нигеҙендә ысын мәғәнәһендә башҡорт теленең милли корпусын барлыҡҡа килтереү.


Диалекттарҙы өйрәнеү – милли мәҙәниәтте һаҡлау

– 2022 йылдың башында Лингвистика һәм мәғлүмәт технологиялары лабораторияһынан айырым Ҡулланма лингвистика һәм диалектология бүлеге үҫеп сыҡты. Уның алдына ниндәй бурыстар ҡуйылған?
Зиннур Сиразитдинов:
– Диалекттарҙы өйрәнеү – бө­гөнгө глобалләшеү шарттарын­да туған телде генә түгел, ә халыҡтың этник үҙенсәлектәрен, милли мә­ҙәниәтен дә һаҡлап ҡалыу ул. Диалект материалдары ул әҙәби телдең формалашыуын һәм тарихи яҡтан үҫешен өйрәнеү өсөн иң мөһим сығанаҡтарҙың береһе.
Тел бүлегенә ҡараған лабораторияны айырым бүлек итеү күптән тыуған мәсьәлә ине. Әммә элекке етәкселәр уның мөһимлеген аңлап еткермәне. Зөһрә Рәхмәтуллина был мәсьәләгә төшөнөп, аңлап, айырым бүлек булдырҙы. Эшләп килгән лингвистика һәм мәғлүмәт технологиялары лабораторияһының штатына өс кеше өҫтәлде, улар диалектология мәсьәләләре менән мәшғүл.
Һуңғы махсус диалектология экспедицияһынан утыҙ йыл үтеп киткән. Әлбиттә, һөйләштәрҙә үҙ­гәрештәр ҙә барлыҡҡа килмәй ҡал­мағандыр. Уларҙы ла тикшерергә кәрәк.
Гөлгөнә Шәмсетдинова:
– Башҡорт теле диалектоло­гияһы бөгөнгө көндә ниндәйҙер кимәлдә өйрәнелгән тип әйтергә була. Өс диалект буйынса ла фәнни монографиялар, диалектологик һүҙлектәр баҫылған. Улар күренекле башҡорт телселәре Таһир Байышев, Нәжибә Мәҡсүтова, Сәриә Миржанова тарафынан яҙылған.
Ләкин күп кенә мәсьәләләр һа­ман да өйрәнеп бөтөлмәгән. Айырым һөйләштәрҙе, бер диалекттың икенсеһенә ниндәй йоғонто яһа­уын, бер-береһен тулыландырыу мәсьәләләрен махсус рәүештә өй­рәнеү талап ителә. Ҡыҙғанысҡа ҡаршы, үткән быуаттың 80-се йылдарынан башлап был өлкәлә эш ҡырҡа һүлпәнәйҙе. Был, бер яҡтан, өлкән быуын диалектологтарының китеүе менән, икенсе яҡтан, диа­лектологияға шул ваҡыттарҙағы институт етәкселегенең иғтибары етмәүе менән аңлатыла.
2006 йылдан алып диалектология өлкәһендә бары тик беҙҙең лаборатория эш алып барҙы. Сөнки беҙ бөтә донъяла барған компью­терлаштырыу, технологиялар
үҫеше заманында диалект мате­риалдарының ҡағыҙҙа ғына сик­ләнгән тираж менән баҫылыуы ғалимдар, тикшеренеүселәр, ғөмү­мән, был материалдар менән ҡы­ҙыҡһыныусылар өсөн ҙур етешһеҙ­лек булып тороуын аңлай инек. Шуға ла диалект материалдарын электрон форматҡа күсереп, киң ҡулланыуға сығарыр өсөн Башҡорт теленең машина фондында диалектологик база эшләргә ҡарар иттек.
Лаборатория хеҙмәткәрҙәре тарафынан өс айырым базанан торған диалектологик база эшләнде: лексика базаһы, диалектологик атлас һәм текстар базаһы.
Лексик базала башҡорт теленең диалект лексикаһы тураһында мәғ­лүмәт бирелә, һәм ул әлегә тиклем төҙөлгән һәм баҫтырылған диалект һүҙлектәре нигеҙендә эшләнгән. Бөгөнгө көндә базала 52 меңдән ашыу диалект берәмеге бар, улар алты мәғлүмәт күрһәткесенән тора: диалект һүҙе, һүҙ төркөмө, диалект, һөйләш, әҙәби норма, рус теленә тәржемә. Ошо күрһәткестәр аша эҙләү башҡарырға мөмкин.
Диалектологик атлас базаһы «Башҡорт теленең диалектоло­гик атласы» материалдары ниге­ҙендә төҙөлгән. Унда Тарих, тел һәм әҙәбиәте институты диалекто­логтарының 1976–1987 йылдарҙа Башҡортостандың төрлө райондарында һәм күрше өлкәләрҙә йәшәгән башҡорттарҙың һөйләү телен тикшереп, экспедициялар ваҡытында яҙып алынған бик күп диалект материалдары тупланған. Диалектологик атлас базаһы үҙ эсенә фонетик, морфологик, лексик һәм синтаксик күренештәрҙе ала. Уңайлы эҙләү ысулы менән кәрәкле мәғлүмәтте тиҙ генә табып була.
Текстар базаһы иһә Тарих, тел һәм әҙәбиәт институты хеҙ­мәткәрҙәре, Лингвистика һәм мәғлүмәт технологиялары лабо­раторияһы коллективы экспедициялар ваҡытында йыйған иллюстратив материалдан тора. Был база тураһында алдараҡ коллегаларым бер аҙ әйтеп китте инде. Беҙ уны диалект текстары корпусы тип тә йөрөтәбеҙ. Бында инде башҡорт телендә һөйләшеүселәрҙең телмәр өлгөләре тупланған. Текс­тарҙың күләме төрлөсә – бер нисә һөйләмдән алып бер нисә биткә тиклем. Базала тексты эҙләү өсөн бер нисә күрһәткес бар: диалект, һөйләш, яҙып алыу йылы, мәғлү­мәтсенең белеме, йәше, енесе, мил­ләте. Ошо күрһәткестәрҙең ниндәйе буйынса булһа ла кәрәкле тексты табып була. Был текстар лингвистик тикшеренеүҙәр өсөн бик бай материал.

– Башҡорт теленең диалекттарын өйрәнеү, фәнни яҡтан анализлау эшен тергеҙеү өсөн ниндәй маҡсаттар ҡуйҙығыҙ?

Зиннур Сиразитдинов:
– Диалектология мәсьәләләре менән бүлектә өлкән ғилми хеҙ­мәткәр, филология фәндәре кандидаты Линара Камил ҡыҙы Ишкилдина, ғилми хеҙмәткәр, филология фәндәре кандидаты Мәҙинә Раил ҡыҙы Вәлиева һәм ғилми хеҙмәткәр Рәмилә Ниғәмәтйән ҡыҙы Кәримова шөғөлләнә. Уларҙың маҡсаты – төньяҡ-көнбайыш диалектына ҡараған Ҡариҙел һәм Танып һөйләштәрен тикшереп сығып, барлыҡҡа килгән үҙгәрештәрҙе асыҡлау. Бының өсөн улар экспе­дицияларға сыға. Ҡариҙел районында дүрт тапҡыр булып, бай материал алып ҡайттылар. Уларҙы махсус компьютер программалары ярҙамында эшкәртәләр. Быйыл Асҡын районына барырға уйлайҙар. Йыйған фонетик, лексик материалдары, аудиотекстары мәғлүмәт базаһына керәсәк. Асҡын районын тикшереп бөткәс, Балтас, Борай, Бөрө, Тәтешле райондарына, йәғни Танып һөйләшенә күсәләр. Артабанғы планда ошо төньяҡ-көнбайыш диалектын тулыһынса тикшереү.

– Телебеҙҙе һаҡлау һәм үҫ­тереү өсөн башҡарған мөһим эштәрегеҙҙә уңыштар теләйбеҙ һеҙгә!

Башҡорт телен үҫтереүҙә ғәмәли эш
Башҡорт телен үҫтереүҙә ғәмәли эш
Башҡорт телен үҫтереүҙә ғәмәли эш
Башҡорт телен үҫтереүҙә ғәмәли эш
Башҡорт телен үҫтереүҙә ғәмәли эш
Башҡорт телен үҫтереүҙә ғәмәли эш
Автор:Миләүшә МӨХӘМӘТЙӘНОВА, «Ватандаш»
Читайте нас