– Машина фонды, һис шикһеҙ, хәҙерге һанлы технологиялар заманында башҡорт телен үҫтереү һәм һаҡлау маҡсатында башҡарылған бик мөһим сара. Һеҙ тормошҡа ашырған проекттың дәүләт кимәлендә танылыу яулауын был мәсьәләнең әһәмиәтен билдәләү тип аңлайбыҙ.
Лилиә Боҫҡонбаева:
– Эйе, бөгөн барлыҡ өлкәләрҙә лә, шул иҫәптән тел өлкәһендә лә, цифрлаштырыу эше бара, шуға күрә был заман талабы тип әйтергә кәрәк, сөнки ошо процестан тороп ҡалһаҡ, телебеҙҙең киләсәге бик хәүефле булыр. Беҙҙең институтта ла был йүнәлештә күп кенә эштәр башҡарыла. Милли телебеҙҙә һаҡланған, телебеҙгә ҡағылышлы булған һәр мәғлүмәт электрон вариантта булып, интернет селтәре аша бөтә донъяға асыҡ булырға тейеш тигән маҡсатта Башҡорт теленең машина фонды булдырылды. Фонд, телселәр, уҡытыусылар, студенттар һәм мәктәп уҡыусылары өсөн башҡорт теле буйынса мәғлүмәт эҙләү системаһы булараҡ, бик күп һәм бай материал туплаған.
– Башҡорт теленең машина фонды күп йыллыҡ хеҙмәтегеҙҙең һөҙөмтәһе. Эш барышы хаҡында беҙҙең журналда ла мәҡәләләрегеҙ баҫылып сыҡты. Проектҡа нигеҙ һалыныу һәм артабанғы мөһим, хәл иткес ваҡиғаларҙы иҫкә төшөргәндә, эште ниндәй этаптарға бүлергә була?
Анита Ишмөхәмәтова:
– 1993 йылда Зиннур Әмир улы Сиразитдинов Өфө ғилми үҙәгенең президиумында Башҡорт теленең машина фондының концепцияһы тураһында сығыш яһай. 2002 йылда «Башҡортостан халыҡтары телдәрен һаҡлау, өйрәнеү һәм үҫтереү» дәүләт программаһының «Башҡорт теле һанлы технологияларҙа» бүлеген тормошҡа ашырыу маҡсатында институттың Тел бүлегендә Лингвистика һәм мәғлүмәт технологиялары лабораторияһы булдырыла. Ошо ваҡыттан проект өҫтөндә эҙмә-эҙлекле эш башлана.
2003 йылда лаборатория хеҙмәткәрҙәре тарафынан физика-математика фәндәре кандидаты Владимир Иванович Луценко менән берлектә Машина фондының пилот проекты эшләнә. Шул проект буйынса тәүҙә фонд институт компьютерҙары өсөн генә тәғәйенләнә. Артабан уны корпоратив селтәр рәүешендә, йәғни беҙҙең институт ғалимдары, Башҡорт дәүләт университеты, Башҡорт дәүләт педагогия институты уҡытыусылары өсөн эшләргә тигән фекер тыуа. 2006 йылдан алып фондты интернетта барлыҡ ҡулланыусылар өсөн асыҡ система рәүешендә эшләргә тигән ҡарар ҡабул ителде. Программалау эшендә Анатолий Ильич Полянин ҙур ярҙам күрһәтте.
2007–2012 йылдарҙа беҙҙең коллектив Башҡорт теленең машина фондына ингән ете мәғлүмәт базаһын тулыландырҙы. 2013 йылдан проза, публицистика, фольклор текстарын үҙ эсенә алған корпус проекттары менән шөғөлләндек. 2017–2021 йылдарҙа «Башҡорт теленең диалект текстары корпусын булдырыу» исемле тема сиктәрендә, Ҡыҙыл, Әй, Учалы
һөйләштәренән йыйылған 765 аудиояҙманы транскрипциялап, базаға индерҙек. 2023 йылда башҡорт телендә киң мәғлүмәт сараларының һөйләү корпусын төҙөү өҫтөндә эш башланды.
– Хәҙерге көндә фондтың күләме ниндәй, ул ниндәй бүлектәрҙән тора?
Лилиә Боҫҡонбаева:
– Башҡорт теленең машина фонды – ул мәғлүмәт эҙләү системаһы, автоном мәғлүмәт базалары менән эшләгән махсуслаштырылған системаларҙы үҙ эсенә ала. Уны Интернет селтәрендә https://mfbl2.ru адресы буйынса табырға мөмкин. Бөгөнгө көндә фонд ун ҙур бүлектән тора: дөйөм картотека, лексикографик, эксперименталь-фонетик, грамматик, диалектологик базалар, ҡулъяҙма һәм иҫке баҫма китаптар каталогтары базалары, проза, публицистик һәм фольклор әҫәрҙәре текстарын үҙ эсенә алған корпус базалары. Лингвистик мәғлүмәттәр базаларының дөйөм һаны – 75 берәмек.
Мәҫәлән, лексикография базаһы, башҡорт теленең ғәмәлдәге автор һүҙлектәренән сығып, һүҙ тураһында мәғлүмәт бирә. Бүлеккә 58 һүҙлек индерелгән, һүҙлек мәҡәләләренең дөйөм күләме – 400 мең берәмек. Базала академик һәм уҡыу һүҙлектәре: бер һәм ике телле, йышлыҡ, терминологик, фразеологик, синонимдар һүҙлектәре; һүҙлек-белешмәләр: торлаҡ пункттар, ҡала урамдары исемдәре, Башҡортостандың һыу һәм тау объекттары атамалары һүҙлектәре һәм башҡалар бирелгән.
Грамматик базаға гипертекст форматында бирелгән башҡорт теленең академик грамматикаһы –1981 йылда Мәскәү ҡалаһында донъя күргән «Грамматика современного башкирского литературного языка» баҫмаһы, исемдәр һәм ҡылымдар буйынса квантитатив морфологик базалар индерелгән.
Машина фондында башҡорт теленең корпус проекттары ла урын алған. Проза корпусы башҡорт яҙыусыларының 1920 йылдар аҙағынан алып хәҙерге ваҡытҡа тиклем баҫылған текстарын үҙ эсенә ала. Корпустың дөйөм күләме – 30 миллион һүҙ ҡулланыш. Публицистик корпусҡа һуңғы йылдарҙа нәшер ителгән башҡорт гәзит-журналдарынан алынған текстар инә. Әлеге көндә корпустың дөйөм күләме – 12729949 һүҙҡулланыш. Фольклор корпусының мәғлүмәт базаһы башҡорт халыҡ ауыҙ-тел ижадынан 17951 тексты үҙ эсенә ала. Базаға эпик әҫәрҙәр, әкиәт текстары, мәҡәлдәр, әйтемдәр, йомаҡтар, ышаныуҙар һәм башҡа ҡомартҡылар индерелгән. Базаның дөйөм күләме 855876 һүҙҡулланыш тәшкил итә.
– Системаның мөмкинлектәре менән күберәк кемдәр ҡуллана икән? Шуны анализлау буйынса ниндәйҙер күҙәтеүҙәр, статистика алып барыламы?
Анита Ишмөхәмәтова:
– Башҡорт теленең машина фонды фән менән шөғөлләнеүселәргә, һүҙлек төҙөүселәргә, вуз уҡытыусыларына, студенттарға, мәктәп уҡытыусыларына һәм уҡыусыларына, аспиранттарға, ғөмүмән, башҡорт теле менән ҡыҙыҡһыныусыларҙың барыһына ла тәғәйенләнә.
Беҙҙең өсөн фондҡа кем, ҡайһы төбәктән, ҡасан ингәне һәм күберәк ниндәй бүлектәргә мөрәжәғәт итеүе мөһим. Бындай статистиканы алып барыу өсөн махсус бүлек булдырылған. Ҡулланыусылар күбеһенсә лексикография бүлегенән һүҙҙәрҙең тәржемәһен эҙләй. Шулай уҡ диалекттар менән дә ҡыҙыҡһыныусылар күп. Рәсәй буйынса иң күп кереүселәр – Мәскәү ҡалаһынан, уға етә – Түбәнге Новгород. Сит илдәрҙән – Норвегия, Голландия.
– Был күләмле, ҡатмарлы хеҙмәтте атҡарып сығыу еңел генә бирелмәгәндер. Эш барышында ниндәй ҡыйынлыҡтар булды?
Зиннур Сиразитдинов:
– Фәнни эштә барлыҡҡа килгән ҡыйынлыҡтар күпселек осраҡта финанстарға бәйле була. Беҙҙең эштә лә шулай булды. Әйтеп китәйем, Лингвистика һәм мәғлүмәт технологиялары лабораторияһы 2000–2005 йылдарҙа ҡабул ителгән «Башҡортостан Республикаһы халыҡтары телдәрен һаҡлау, өйрәнеү һәм үҫтереү» дәүләт программаһына ярашлы барлыҡҡа килде. Йәғни шул программаның «Башҡорт теле информацион технологияларҙа» тигән, фәнни-тикшеренеү лаборатория ойоштороуға ҡағылышлы 5.2 пункты нигеҙендә. Был дәүләт программаһы 2006–2010, 2012–2016, 2019–2024 йылдарҙа артабан дауам ителде, әммә 2012 йылдан алып программаны финанслау туҡтатылды. Бары тик Башҡортостан Фәндәр академияһы тарафынан билдәләнгән аҙ күләмле өс грант ҡына алдыҡ. Ә лабораторияла ете кеше эшләй ине. Ярай әле федераль гранттар – Рәсәй гуманитар ғилми фонды, Рәсәй фундаменталь тикшеренеүҙәр фондының гранттары булды. Хәйер, уларҙың да күләме ҙур түгел ине. Шул уҡ ваҡытта грант аҡсаһы йылдың аҙағына ғына килә ине. Ә лаборатория хеҙмәткәрҙәре башҡа бер урында ла эшләмәй, уларҙың ғаиләһе бар, ҡайһы берҙәре күп балалы. Бик ауыр булды. Ҡайһы берәүҙәр эштән китте, ләкин бына беҙ дүртебеҙ ҡалдыҡ. Телебеҙгә, халҡыбыҙға хеҙмәт итеү теләге көслө ине. Ә шул уҡ ваҡытта Сыктывкарҙа, Элистала, Ҡазанда коллегаларыбыҙ бюджетта ине. Шул йылдарҙа Татарстанда эшләп килгән лаборатория киңәйеп институтҡа әйләнде, ундағы хеҙмәткәрҙәр бюджет ставкаларында эшләп, шундай уҡ дәүләт программаларында ла ҡатнашып, өҫтәмә рәүештә аҡса алды. Ҡыҙғанысҡа ҡаршы, минең Башҡортостан Фәндәр академияһына, ул ваҡыттағы республика етәксеһе Р.Хәмитовҡа мөрәжәғәттәрем яуапһыҙ ҡалды. Инде беҙҙең институтҡа Зөһрә Йыһанур ҡыҙы Рәхмәтуллина директор булып тәғәйенләнгәс кенә хәлдәр үҙгәрҙе – хеҙмәткәрҙәр институт штатына тулы ставкаларға алынды.
– Башҡорт теленең машина фондын булдырыуҙан тыш, һеҙ тағы ла ниндәй проекттар башҡараһығыҙ, ниндәй фәнни темалар өҫтөндә эшләйһегеҙ?
Лилиә Боҫҡонбаева:
– Бында башҡорт теленең Терминологик базаһын әйтеп китергә кәрәк. Был базаны интернет селтәрендә http://bashterm.ru/ адресы буйынса табырға мөмкин.
Ғәмәли лексикографияла эштең ҙур өлөшөн терминологик һүҙлектәр төҙөү тәшкил итә. Был эштә лексикографтарға махсус терминологик мәғлүмәт базалары ҙур ярҙам күрһәтә. Улар бындай төрҙәге һүҙлектәр төҙөүҙе автоматлаштырып ҡына ҡалмай, ә терминдар картотекаһын булдырыу, уны тулыландырыу кеүек процестарҙы ла үҙ эсенә ала. Башҡорт тел ғилемендә терминологик һүҙлектәр күп төҙөлгән. Һуңғы 20–25 йыл эсендә генә фән, техника, сәнәғәт һәм ауыл хужалығының төрлө өлкәләренә ҡараған егерменән ашыу һүҙлек баҫылып сыҡҡан. Әммә башҡорт терминологияһы буйынса мәғлүмәт базаһы булмауы был йүнәлештәге эште ниндәйҙер кимәлдә тотҡарлай ине. Мәғлүмәт банкын төҙөү 2012 йылда башлана, гуманитар һәм тәбиғи фәндәр, төрлө хужалыҡ тармаҡтары буйынса ике телле – русса-башҡортса һәм башҡортса-русса терминология буйынса бүлектәр булдырылды.
Мәғлүмәт банкының базаларына теркәүҙең төп элементы – терминологик һүҙ. Уның бөтә варианттары ла, йәғни орфографик, һүҙ яһаусы һәм лексик-синтаксик варианттары теркәлә. Терминологик база элементтары ул ябай һәм составлы һүҙҙәр, мәҫәлән, архитектоника – баш мейеһе ҡабығы архитектоникаһы, шулай уҡ терминдарҙың ҡыҫҡа һәм тулы варианттары, мәҫәлән, юғары уҡыу йорто – вуз, электрокардиограмма – ЭКГ.
Мәғлүмәт базаларында термин башҡортса һәм рус теленә тәржемәлә бирелә, ниндәй һүҙ төркөмөнә ҡарағанлығы, әгәр булһа, – омонимияһы, ҡулланыу нормаһы билдәләп үтелә, йәғни стандартлаштырылғанмы ул, тәҡдим ителгәнме, рөхсәт ителгәнме. Шулай уҡ терминдың төҙөлөшө күрһәтелә, йәғни термин ябай һүҙҙән торамы әллә ҡушма һүҙҙәнме һәм башҡалар.
Әлеге көндә рус һәм башҡорт теле терминдарының дөйөм күләме 200 меңдән ашыу берәмек тәшкил иткән терминологик базалар төҙөлгән. Терминды уңайлы эҙләү системаһы һәм бөтә ҡылыҡһырламаларҙы билдәләү мөмкинлеген биргән программа эшләнгән.
Зиннур Сиразитдинов:
– Ваҡытында машина фондтарын төҙөүгә тиҫтәләгән ғилми конференциялар арналды, мәҡәләләр, монографиялар яҙылды. 2001 йылда рус теленең фонды буйынса – докторлыҡ диссертацияһы, 2002 йылда татар теле буйынса кандидатлыҡ диссертацияһы яҡланды. Беҙ ҙә техник эш менән генә сикләнмәнек, уның теоретик мәсьәләләрен сисеп, ғилми мәҡәләләр яҙҙыҡ, 2013 йылда коллектив монография ла сығарҙыҡ.
Әлбиттә, беҙҙең коллективтың ғилми эше фондты төҙөү менән генә сикләнмәне. Фондты булдырған осорҙа Лилиә Айса ҡыҙы кандидатлыҡ диссертацияһын яҡланы. Анита Шәүҡәт ҡыҙы менән Гөлгөнә Ғазнауи ҡыҙы диссертацияларын
яҙып, яҡлау алдында торалар. Үҙҙәренең эштәре тураһында коллегаларым үҙҙәре әйтеп китһә дөрөҫ булыр.
Лилиә Боҫҡонбаева:
– Машина фондында урын алған бай фактик материал телселәрҙең иғтибарын әлегәсә тикшерелмәгән мәсьәләләргә йүнәлтергә булышлыҡ итә. Мәҫәлән, әлеге көндә йәнле һөйләү теле бөтөнләй тикшерелмәгән тип әйтерлек. Был проблеманың төп сәбәбе – йәнле һөйләү теле үрнәктәре етерлек кимәлдә булмауы ине. Фондтың диалектологик бүлегендә бирелгән текстологик базаға хәҙерге көндә 800-гә яҡын текст индерелгән. Бында һүҙҙәр генә түгел, ә сегментация билдәләре, телмәрҙең паралингвистик элементтары, мәҫәлән, көлөү, ыңғырашыу, йүткереү, паузалар, хезитативтар кеүек төрлө хезитацион күренештәр бирелә. Ошо бүлек материалы нигеҙендә мин телмәрҙә барлыҡҡа килгән паузаларҙы тикшерҙем. Паузалар телмәрҙе фразаларға һәм синтагмаларға бүлеүсе сара ғына булып ҡалмай, ә йыш ҡына һөйләүсенең артабанғы фекерен планлаштырыуҙа билдәле бер ҡатмарлыҡтар килеп тыуған осраҡта ла барлыҡҡа килә. Буш паузалар менән бер рәттән шулай уҡ ниндәйҙер өндәр ярҙамында, мәҫәлән, э-э, ә-ә-ә, йәиһә вербаль хезитативтар ярҙамында бирелә ала. Мәҫәлән, һәр беребеҙҙең телмәрендә иң йыш осраған һүҙ ниндәй тип уйлайһығыҙ? Ул – «ни» йәки «ней». Йыш ҡына ниндәйҙер һүҙ тел осонда була, иҫкә төшмәй. Шул осраҡта һөйләүсе ул һүҙҙе аңлатып тормай, уның урынына «ни» хезитативын ҡуллана.
Шулай уҡ 2023 йылда Рәсәй фән фондының ике йылға иҫәпләнгән грантын оттоҡ. Грант өҫтөндә эш барышында һөйләү телендә күпләп осраған рус теле материалы тикшерелә. Башҡорт телендә эквиваленты булып та, телмәребеҙҙә ассимиляцияланмаған лексикаға ҡараған күп рус һүҙҙәрен ҡушып һөйләйбеҙ. Грант өҫтөндә эшләгән коллектив менән йыйған йәнле һөйләү үрнәктәре нигеҙендә был һүҙҙәрҙең прагматик функцияларын, төҙөлөшөн, тематик төркөмдәрен тикшерәбеҙ.
Анита Ишмөхәмәтова:
– «Башҡорт теленең диалекттарында фармакофитонимдар» тигән ғилми эшемде әҙерләгәндә Машина фондына ингән материалдарҙы ҡулланып тикшереүҙәр үткәрҙем. Мәҫәлән, лексикография бүлегенә ингән һүҙлектәрҙән энәлек фармакофитонимының һыуһар, дунала, энәте, еҙәй, ҡамыраш булып медицина, умартасылыҡ, урман эше, ауыл хужалығы терминдары буйынса төҙөлгән ике телле һүҙлектәрҙә теркәлеүе асыҡланды һәм был ҡыуаҡтың бер нисә төрө барлығы билдәләнде: сәнскеле еҙәй, көнсығыш еҙәйе, ғәҙәттәге еҙәй, Себер еҙәйе. Диалектология базаһына мөрәжәғәт итеп, башҡорт һөйләштәрендә был һүҙҙең илленән ашыу варианты ҡулланылыуын белдек. Башҡорт яҙыусылары ижад иткән әҫәрҙәр һәм шулай уҡ халыҡ ижады өлгөләренән алынған миҫалдар кәрәкле һүҙҙең ниндәй формала нисә тапҡыр ҡулланылғанын тикшергәндә файҙаланылды. Публицистика корпусынан алынған миҫалдар үҫемлектең шифалы икәнлеген генә күрһәтеп ҡалмай, халыҡ медицинаһының хәҙерге көндәге әһәмиәтен иҫбатлай. Ә инде дарыу үҫемлектәренең лексикаһын тикшереү, диалекттарҙа нисек әйтелешен өйрәнеү тел тарихын өйрәнеүселәр өсөн дә, халыҡ тарихын һәм этнографияһын өйрәнеүселәр өсөн дә берҙәй әһәмиәтле, сөнки лексиканың был ҡатламы халыҡтың мәҙәниәтен, тик шул ерлеккә генә хас үҙенсәлектәрен сағылдыра, тип уйлайым.
Гөлгөнә Шәмсетдинова:
– Минең әлеге ваҡытта эшләгән фәнни темам «Ҡуҙыйкүрпәс менән Маянһылыу» эпосына арналған. Белеүебеҙсә, был эпос төрки халыҡтар араһында киң таралған, ул ҡаҙаҡтарҙа, нуғайҙарҙа, Алтай халҡында осрай. Бөгөнгө көндә эпостың варианттары Рәсәй Фәндәр академияһының Өфө федераль тикшеренеүҙәр үҙәгенең фәнни архивында һәм Өфө фән һәм технологиялар университеты башҡорт теле һәм әҙәбиәте кафедраһының фольклор фондында һаҡлана. Машина фондының фольклор корпусына был эпостың Тарих, тел һәм әҙәбиәт институтының фольклор бүлеге хеҙмәткәрҙәре тарафынан төрлө йылдарҙа экспедицияларҙа яҙып алынған ике версияһы һәм 32 варианты индерелде. Эпостың машина фондына ингән бөтә текстарының берләшмәһе буйынса йышлыҡ һүҙлеге төҙөлдө. Был лексикографтарға һәм стилистарға тикшеренеүҙәр өсөн ҡыҙыҡлы буласаҡ. Артабан эпостың лексикаһы, стиле, теле сағыштырма планда ҡараласаҡ.
Зиннур Сиразитдинов:
– Мин корпус төҙөү осоронда телебеҙҙең һүҙ үҙгәреше моделен барлыҡҡа килтерҙем. Ундай моделдәр морфоанализ яһаусы программалар, орфографияны автоматик рәүештә тикшереү һәм бар булған интеллектуаль системалар нигеҙендә ята.
Корпус материалдары башҡорт теленең синтаксисына яңы күҙлектән ҡарарға мөмкинлек бирә. Әлбиттә, был өлкәлә арҙаҡлы ғалимдарыбыҙ Ғәли Сәйетбатталов һәм Данис Тәкәев тарафынан телебеҙҙең синтаксисы ентекле өйрәнелгән. Ләкин фән бер урында тормай. Хәҙерге көндә синтаксисты моделләү ысулы алға сыға. Данис Солтан улы менән Ғәли Ғәли улының бай тикшеренеү материалдары нигеҙендә башҡорт синтаксик структураларының моделдәрен аныҡлау йүнәлешенә юл һалынды, ябай һөйләмдең структур-семантик моделдәре тәҡдим ителде. Әммә тел ғилемендә, әйтеп китеүемсә, яңы ҡараштар, ысулдар барлыҡҡа килеп тора. Синтаксиста шуларҙың береһе булып предикат менән облигаторлы актанттарҙан торған һөйләмдең минималь структураһын билдәләп, яңыса моделләү тора. Был ысул һөйләмдәрҙең структур һандарын кәметеп, моделдәрҙе компакт рәүештә барлыҡҡа килтерә. Ошо йүнәлештә беҙ башҡорт мәҡәлдәре синтаксисын тикшерә башланыҡ. Артабан бындай тикшеренеүҙәр проза һәм публицистика стилендәге текстарға ла йәйелдереләсәк. Был инде дөйөм башҡорт теле буйынса компакт рәүештәге моделдәрҙе булдырыу тигән һүҙ. Ә ул ни өсөн кәрәк, тиерһегеҙ. Синтаксик моделдәр текстарҙың структураһын автоматик рәүештә анализларға мөмкинлек бирә. Был инде компьютер тәржемәһен, мәғлүмәт эҙләү эштәрен камил башҡарырға мөмкинлек бирә һәм милли яһалма интеллектты төҙөү нигеҙе булып тора.
– Ҡуйған маҡсаттарығыҙға ирешеүегеҙҙе теләйбеҙ. Корпус өҫтөндәге эште артабан ниндәй йүнәлештә алып барырға уйлайһығыҙ?
Зиннур Сиразитдинов:
– Корпус өҫтөндәге эштә маҡсаттар ҙур ғына. Уның күләмен 100 миллион һүҙҡулланышҡа еткерергә ине. Быны ике юҫыҡта башҡарырға ниәтләйбеҙ. Беренсенән, булған корпус проекттарының һанын арттырырға уйлайбыҙ. Икенсенән, яңы корпус проекттарын булдырырға фаразлайбыҙ: фәнни текстар корпусы, район гәзиттәре корпусы, башҡортса-русса текстарҙың параллель корпусы, документтар, хөкүмәт ҡарарҙарын үҙ эсенә алған рәсми ҡағыҙҙар корпусы, һөйләштәрҙең транскрипциялары һәм аудиоматериалдары корпусы. Планыбыҙҙа шулай уҡ башҡорт һөйләштәренең геоинформацион атласын булдырыу. Был атлас, Машина фондында булған атластан айырмалы рәүештә, карталарҙа һөйләш үҙенсәлектәрен динамик рәүештә булдыра, йәғни ҡулланыусы ниндәй һөйләш үҙенсәлектәрен күрһәтһә, шуларға ярашлы изоглоссалы карталар барлыҡҡа килтерелә. Әлеге көндә карталар статик, улар ғалимдар тарафынан билдәләнгән изоглоссаларҙан торған карталар ғына, шунлыҡтан уларҙың һаны ла сикле.
Быйылдан тел буйынса 2024–2030 йылдарға яңы программа эшләй башларға тейеш, уның буйынса беҙ байтаҡ эштәр башҡарырға уйлайбыҙ. Беләһегеҙме, мәғлүмәт технологиялары өлкәһендә үҙгәрештәр үтә тиҙ була. Ниндәйҙер программа, мәғлүмәт системаһы эшләнеп сыҡҡас, ул өс-дүрт йыл эсендә иҫкерә, яңыртырға кәрәк. Быны ребилдинг тигән термин менән атайҙар. Мәҫәлән, Windows, MS Office, Photoshop һәм башҡа программалар бик тиҙ яңырып тора, яңы версиялары сыға. Шул уҡ рус, татар телдәренең милли корпустары бер нисә тапҡыр ребилдинг үтте. Ә беҙҙең машина фондыбыҙ инде 18 йыл бер үк интерфейста, бер үк функционалда йәшәп килә, бары тик күләме генә арта. Быйыл ребилдинг үткәрһәк тип өмөтләнәм. Минең арманым – корпус проекттарының күләмен ҡырҡа арттырыу һәм уларҙың нигеҙендә ысын мәғәнәһендә башҡорт теленең милли корпусын барлыҡҡа килтереү.
– 2022 йылдың башында Лингвистика һәм мәғлүмәт технологиялары лабораторияһынан айырым Ҡулланма лингвистика һәм диалектология бүлеге үҫеп сыҡты. Уның алдына ниндәй бурыстар ҡуйылған?
Зиннур Сиразитдинов:
– Диалекттарҙы өйрәнеү – бөгөнгө глобалләшеү шарттарында туған телде генә түгел, ә халыҡтың этник үҙенсәлектәрен, милли мәҙәниәтен дә һаҡлап ҡалыу ул. Диалект материалдары ул әҙәби телдең формалашыуын һәм тарихи яҡтан үҫешен өйрәнеү өсөн иң мөһим сығанаҡтарҙың береһе.
Тел бүлегенә ҡараған лабораторияны айырым бүлек итеү күптән тыуған мәсьәлә ине. Әммә элекке етәкселәр уның мөһимлеген аңлап еткермәне. Зөһрә Рәхмәтуллина был мәсьәләгә төшөнөп, аңлап, айырым бүлек булдырҙы. Эшләп килгән лингвистика һәм мәғлүмәт технологиялары лабораторияһының штатына өс кеше өҫтәлде, улар диалектология мәсьәләләре менән мәшғүл.
Һуңғы махсус диалектология экспедицияһынан утыҙ йыл үтеп киткән. Әлбиттә, һөйләштәрҙә үҙгәрештәр ҙә барлыҡҡа килмәй ҡалмағандыр. Уларҙы ла тикшерергә кәрәк.
Гөлгөнә Шәмсетдинова:
– Башҡорт теле диалектологияһы бөгөнгө көндә ниндәйҙер кимәлдә өйрәнелгән тип әйтергә була. Өс диалект буйынса ла фәнни монографиялар, диалектологик һүҙлектәр баҫылған. Улар күренекле башҡорт телселәре Таһир Байышев, Нәжибә Мәҡсүтова, Сәриә Миржанова тарафынан яҙылған.
Ләкин күп кенә мәсьәләләр һаман да өйрәнеп бөтөлмәгән. Айырым һөйләштәрҙе, бер диалекттың икенсеһенә ниндәй йоғонто яһауын, бер-береһен тулыландырыу мәсьәләләрен махсус рәүештә өйрәнеү талап ителә. Ҡыҙғанысҡа ҡаршы, үткән быуаттың 80-се йылдарынан башлап был өлкәлә эш ҡырҡа һүлпәнәйҙе. Был, бер яҡтан, өлкән быуын диалектологтарының китеүе менән, икенсе яҡтан, диалектологияға шул ваҡыттарҙағы институт етәкселегенең иғтибары етмәүе менән аңлатыла.
2006 йылдан алып диалектология өлкәһендә бары тик беҙҙең лаборатория эш алып барҙы. Сөнки беҙ бөтә донъяла барған компьютерлаштырыу, технологиялар
үҫеше заманында диалект материалдарының ҡағыҙҙа ғына сикләнгән тираж менән баҫылыуы ғалимдар, тикшеренеүселәр, ғөмүмән, был материалдар менән ҡыҙыҡһыныусылар өсөн ҙур етешһеҙлек булып тороуын аңлай инек. Шуға ла диалект материалдарын электрон форматҡа күсереп, киң ҡулланыуға сығарыр өсөн Башҡорт теленең машина фондында диалектологик база эшләргә ҡарар иттек.
Лаборатория хеҙмәткәрҙәре тарафынан өс айырым базанан торған диалектологик база эшләнде: лексика базаһы, диалектологик атлас һәм текстар базаһы.
Лексик базала башҡорт теленең диалект лексикаһы тураһында мәғлүмәт бирелә, һәм ул әлегә тиклем төҙөлгән һәм баҫтырылған диалект һүҙлектәре нигеҙендә эшләнгән. Бөгөнгө көндә базала 52 меңдән ашыу диалект берәмеге бар, улар алты мәғлүмәт күрһәткесенән тора: диалект һүҙе, һүҙ төркөмө, диалект, һөйләш, әҙәби норма, рус теленә тәржемә. Ошо күрһәткестәр аша эҙләү башҡарырға мөмкин.
Диалектологик атлас базаһы «Башҡорт теленең диалектологик атласы» материалдары нигеҙендә төҙөлгән. Унда Тарих, тел һәм әҙәбиәте институты диалектологтарының 1976–1987 йылдарҙа Башҡортостандың төрлө райондарында һәм күрше өлкәләрҙә йәшәгән башҡорттарҙың һөйләү телен тикшереп, экспедициялар ваҡытында яҙып алынған бик күп диалект материалдары тупланған. Диалектологик атлас базаһы үҙ эсенә фонетик, морфологик, лексик һәм синтаксик күренештәрҙе ала. Уңайлы эҙләү ысулы менән кәрәкле мәғлүмәтте тиҙ генә табып була.
Текстар базаһы иһә Тарих, тел һәм әҙәбиәт институты хеҙмәткәрҙәре, Лингвистика һәм мәғлүмәт технологиялары лабораторияһы коллективы экспедициялар ваҡытында йыйған иллюстратив материалдан тора. Был база тураһында алдараҡ коллегаларым бер аҙ әйтеп китте инде. Беҙ уны диалект текстары корпусы тип тә йөрөтәбеҙ. Бында инде башҡорт телендә һөйләшеүселәрҙең телмәр өлгөләре тупланған. Текстарҙың күләме төрлөсә – бер нисә һөйләмдән алып бер нисә биткә тиклем. Базала тексты эҙләү өсөн бер нисә күрһәткес бар: диалект, һөйләш, яҙып алыу йылы, мәғлүмәтсенең белеме, йәше, енесе, милләте. Ошо күрһәткестәрҙең ниндәйе буйынса булһа ла кәрәкле тексты табып була. Был текстар лингвистик тикшеренеүҙәр өсөн бик бай материал.
– Башҡорт теленең диалекттарын өйрәнеү, фәнни яҡтан анализлау эшен тергеҙеү өсөн ниндәй маҡсаттар ҡуйҙығыҙ?
Зиннур Сиразитдинов:
– Диалектология мәсьәләләре менән бүлектә өлкән ғилми хеҙмәткәр, филология фәндәре кандидаты Линара Камил ҡыҙы Ишкилдина, ғилми хеҙмәткәр, филология фәндәре кандидаты Мәҙинә Раил ҡыҙы Вәлиева һәм ғилми хеҙмәткәр Рәмилә Ниғәмәтйән ҡыҙы Кәримова шөғөлләнә. Уларҙың маҡсаты – төньяҡ-көнбайыш диалектына ҡараған Ҡариҙел һәм Танып һөйләштәрен тикшереп сығып, барлыҡҡа килгән үҙгәрештәрҙе асыҡлау. Бының өсөн улар экспедицияларға сыға. Ҡариҙел районында дүрт тапҡыр булып, бай материал алып ҡайттылар. Уларҙы махсус компьютер программалары ярҙамында эшкәртәләр. Быйыл Асҡын районына барырға уйлайҙар. Йыйған фонетик, лексик материалдары, аудиотекстары мәғлүмәт базаһына керәсәк. Асҡын районын тикшереп бөткәс, Балтас, Борай, Бөрө, Тәтешле райондарына, йәғни Танып һөйләшенә күсәләр. Артабанғы планда ошо төньяҡ-көнбайыш диалектын тулыһынса тикшереү.
– Телебеҙҙе һаҡлау һәм үҫтереү өсөн башҡарған мөһим эштәрегеҙҙә уңыштар теләйбеҙ һеҙгә!