شناسایی نواحی اگزون در توالی DNA با طراحی فیلترهای دیجیتال
General Material Designation
[پایاننامه]
Parallel Title Proper
Identification of Exon Location in DNA Sequences Using Filter Based Methodologies
First Statement of Responsibility
/منصوره دهنوی
.PUBLICATION, DISTRIBUTION, ETC
Name of Publisher, Distributor, etc.
: مهندسی پزشکی
Date of Publication, Distribution, etc.
، ۱۴۰۰
PHYSICAL DESCRIPTION
Specific Material Designation and Extent of Item
۱۱۶ص.
Other Physical Details
:
GENERAL NOTES
Text of Note
زبان: فارسی
Text of Note
زبان چکیده: فارسی
NOTES PERTAINING TO PUBLICATION, DISTRIBUTION, ETC.
Text of Note
چاپی - الکترونیکی
NOTES PERTAINING TO PHYSICAL DESCRIPTION
Text of Note
مصور، جدول، نمودار
DISSERTATION (THESIS) NOTE
Dissertation or thesis details and type of degree
کارشناسی ارشد
Discipline of degree
مهندسی پزشکی- بیوالکتریک
Date of degree
۱۴۰۰/۰۴/۰۱
Body granting the degree
صنعتی سهند
SUMMARY OR ABSTRACT
Text of Note
بیوانفورماتیک علم نوینی است که طراحی سیستم های کامپیوتری و مدل های ریاضی، برای نگهداری، تجزیه و تحلیل مجموعه ی عظیمی از داده های بیولوژیکی مانند DNA ،RNAو پروتئین را شامل می شود .یکی از شاخههای اصلی این علم ژنومیک است که هدف اصلی آن درک ماهیت اطلاعات نهفته در ژن ها و نقش آن ها در تعیین عمل کردهای خاصی است که توسط ژن ها بیان می شود .از گام های اصلی برای رسیدن به این هدف، شناسایی ماهیت و موقعیت بخش های مختلف در توالی DNA از جمله نواحی رمزگذار پروتئین) اگزون (است .در این پژوهش، روشی با استفاده از فیلترهای دیجیتال جهت شناسایی نواحی اگزون بر مبنای ویژگی تناوب ۳نواحی اگزون در توالیDNA ارائه شده است .فیلترهای دیجیتال، قابلیت عبور یا تقویت مؤلفه های از پیش تعیین شده ی فرکانسی و نیز حذف یا تضعیف سایر مؤلفه های فرکانسی یک طیف را دارند .روند کلی روش پیشنهادی شامل ۴مرحله است :-۱نگاشت، -۲کاهش نویز، -۳پنجره گذاری و -۴استخراج مؤلفه های تناوب. ۳ ابتدا از روش های مختلف تبدیل توالی کاراکتریDNA به سیگنال دیجیتال، از جمله نگاشت های نیروی متقابل یون الکترون) ،(EIIPمثلثاتی( (Trig و دودویی( (Voss استفاده شده است .سپس سه نوع روش کاهش نویز مختلف تبدیل موجک گسسته) ،(DWTمدل رمزگذار پیش گوی خطی ((LPC و ضدشکافی( (AN روی سیگنال حاصل از هر نگاشت اعمال و در مرحله بعد انواع پنجره گذاری از جمله پنجره های مستطیلی، بارتلت، همینگ، هنینگ، بلک من، کیزر ثابت و کیزر تطبیقی بر روی سیگنال های فیلتر شده به کار گرفته شده اند .سرانجام دو روش الگوریتم گورتزل و تجزیه ی مقادیر منفرد) ،(SVDجهت استخراج مؤلفه های تناوب ۳مورد استفاده قرار گرفته اند .پنجره ی کیزر، بر خلاف سایر پنجره های مورد استفاده که فقط پارامتر طولشان تنظیم می شود، پارامتر دیگری به نام برای کنترل ارتفاع گلبرگ جانبی دارد .در این کار تنظیم پارامتر ،در پنجره ی کیزر تطبیقی، با استفاده از روش گوس نیوتون بازگشتی انجام پذیرفته است .پس از پیاده سازی ترکیب حالت های مختلف نگاشت، کاهش نویز، پنجره گذاری، استخراج مؤلفه های تناوب ۳و بررسی نتایج حاصل در همه ی داده ها، بهترین حالت، ترکیب نگاشت ،Trigکاهش نویز ،ANپنجره ی کیزر ۴۰و روشSVD به دست آمد .جهت ارزیابی عمل کرد از معیارهای ارزیابی سطح زیر منحنی ،ROCدقت، ویژگی، حساسیت و همبستگی تقریبی بر حسب سطح آستانه استفاده نمودیم .در نتایج عددی حاصل از روش پیشنهادی مقدار دقت در آستانه ی انتخاب شده بر اساس بیشینه ی دقت، در بیشتر داده ها بالای ۹۲درصد، مقدار ویژگی و حساسیت در آستانه های انتخاب شده بر اساس بیشینه ی ویژگی و حساسیت در همه داده ها ۱۰۰درصد و مقدار همبستگی تقریبی در آستانه ی انتخاب شده بر اساس بیشینه ی همبستگی در بیشتر داده ها بالای ۷۳درصد است .از بررسی و مقایسه نتایج پنجره ی کیزر تطبیقی با پنجره ی کیزر ثابت عمل کرد بسیار خوب الگوریتم پیشنهادی جهت محاسبه ی پارامترهای پنجره ی کیزر تطبیقی نتیجه گرفته می شود .طبق این الگوریتم، تغییرات در بازه ی ۶/۵ الی ۴۷/۱۱به دست آمد، که بازه ی ۶الی ۵/۷به عنوان بازه ی تغییرات بهینه انتخاب شد .
Text of Note
Bioinformatics is a new science that involves the design of computer systems and mathematical models for storing, analyzing vast sets of biological data such as DNA, RNA, and proteins. One of the main branches of this science is genomics, the main purpose of which is to understand the nature of the information contained in genes and their role in determining the specific functions expressed by genes. One of the main steps to achieve this goal is to identify the nature and location of different parts in the DNA sequence, among proteincoding regions (exon). In this research, a method using digital filters to identify exon regions based on the period-3 property of exon regions in the DNA sequence is presented. Digital filters allow the predetermined frequency components to pass or amplify, and also have the ability to remove or attenuate other frequency components. The general process of the method consists of 4 steps: 1- Mapping, 2- Noise elimination, 3- Windowing, 4- Extraction of period-3 components. First, different methods of converting DNA character sequences into a digital signal, including Electron-Ion Interaction Potentials (EIIP), Trigonometric (Trig), and binary (Voss) maps are used. Then, three different types of noise elimination Discrete Wavelet Transform (DWT), Linear Prediction Coding (LPC), and Anti-Notch (AN) are applied to the signal from each mapping, and in the next step, various types of windowing, including Rectangular, Bartlett, Hamming, Hanning, Blackman, fixed kaiser, and adaptive kaiser are applied to the filtered signals. Finally, two methods of Goertzel and Singular Value Decomposition (SVD) algorithms were used to extract the period-3 components. The Kaiser window, unlike other windows used in which only the length parameter is adjusted, has another parameter called to control the height of the side lobe, and the adaptive Kaiser window is adapted from the parameter tuning using the recursive Gauss-Newton method. After implementing the combination of different mapping modes, noise elimination, window and extraction, and reviewing the results in all data, the best combination Trig mapping, AN noise elimination, Kaiser 40 window and SVD method has been achieved. To evaluate the performance, we used the criteria for evaluating the area under the ROC curve, precision, specificity, sensitivity, and approximate correlation according to the threshold level. In the numerical results of the proposed method, the value of precision in the relevant threshold in most data is above 92 percent, the value of specificity and sensitivity in the relevant thresholds in all data is 100 percent and the approximate correlation value in the relevant threshold in most data is above 73 percent. By reviewing and comparing the results of the Adaptive Kaiser window with the fixed Kaiser window, the excellent performance of the proposed method in calculating the parameters of the adaptive Kaiser window is concluded. According to this algorithm, changes were obtained in the range of 5/6 to 11/47, which was selected from 6 to 7/5 as an optimal change range
ba
PARALLEL TITLE PROPER
Parallel Title
Identification of Exon Location in DNA Sequences Using Filter Based Methodologies
TOPICAL NAME USED AS SUBJECT
اگزون
پنجره ی کیزر
توالی DNA
فیلتر دیجیتال
نواحی رمزگذار پروتئین
UNCONTROLLED SUBJECT TERMS
Subject Term
Exon, Kaiser window, DNA sequences, Digital filter, Protein coding region