هر دارو یا مولکول یک ساختار پیچیده شیمیایی دارد، اما برای اینکه رایانهها بتوانند آن را تحلیل کنند، باید این ساختار به زبان اعداد ترجمه شود. اینجاست که ماتریس ویژگی داروها (Feature Matrix) وارد عمل میشود.
در این ماتریس، هر دارو به صورت یک ردیف و هر ویژگی (Feature) به صورت یک ستون نمایش داده میشود:
ویژگیهای فیزیکوشیمیایی: وزن مولکولی، LogP، بار الکتریکی…
ویژگیهای ساختاری: تعداد حلقههای آروماتیک، پیوندهای هیدروژنی، شاخصهای توپولوژیک…
اثرانگشتهای مولکولی (Molecular Fingerprints): الگوهای دودویی که حضور یا غیاب زیرساختارهای خاص را نشان میدهند.
به این ترتیب، هر دارو یک بردار ویژگی خواهد داشت و مجموعهای از داروها یک ماتریس بزرگ تشکیل میدهند.
این ماتریس پایه بسیاری از روشهای هوش مصنوعی و یادگیری ماشین در طراحی دارو است:
- پیشبینی فعالیت زیستی داروها
- غربالگری مجازی برای یافتن بهترین کاندیدا
- مدلسازی QSAR برای بررسی رابطه ساختار–فعالیت
به زبان ساده، Feature Matrix همان شناسنامه عددی داروهاست که به رایانه امکان میدهد الگوها را کشف کرده و مسیر طراحی داروهای جدید را هموار کند.