Hyppää sisältöön
    • Suomeksi
    • In English
  • Suomeksi
  • In English
  • Kirjaudu
Näytä aineisto 
  •   Etusivu
  • 1. Kirjat ja opinnäytteet
  • Pro gradu -tutkielmat ja diplomityöt sekä syventävien opintojen opinnäytetyöt (kokotekstit)
  • Näytä aineisto
  •   Etusivu
  • 1. Kirjat ja opinnäytteet
  • Pro gradu -tutkielmat ja diplomityöt sekä syventävien opintojen opinnäytetyöt (kokotekstit)
  • Näytä aineisto
JavaScript is disabled for your browser. Some features of this site may not work without it.

Drug-Target Binding Affinity Prediction: Evaluating the Impact of Dataset Size on Model Performance

Karunarathna, Himashi (2025-07-23)

Drug-Target Binding Affinity Prediction: Evaluating the Impact of Dataset Size on Model Performance

Karunarathna, Himashi
(23.07.2025)
Katso/Avaa
Karunarathna_Himashi_Thesis.pdf (890.6Kb)
Lataukset: 

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2025072879432
Tiivistelmä
Drug-target interaction (DTI) prediction plays a crucial role in modern drug discovery. However, real-world DTI prediction is often challenged due to limited availability of known interaction data on drugs and targets. This study investigates how the size of a training dataset influences the performance of a machine learning model, in particular, Kronecker Regularized Least Square model evaluated using Concordance Index under four experimental settings that represent the realistic scenarios in DTI prediction. These four settings are based on whether the test set contains entirely novel drugs and targets, share either drugs or targets in the training set or includes drugs and targets that are both present during the training phase.
The results of the experiment revealed that the model performance heavily varies depending on the experimental setting. Although the model showed improvement of prediction performance under each setting with increased training data size, some settings showed much improvement and better generalization ability than the others. As expected, the model performed best when the model has seen interactions involving the drugs and targets in the test set during training. The model performed well when predicting interactions for unseen targets but struggled to generalize well with novel drugs or both novel drugs and targets.
The findings of the study highlight the importance of addressing each experimental setting individually. While some experimental settings benefited significantly well with the available training data size, others showed only slight improvement though with an upward trend suggesting that more data may help to further improve the performance.
Kokoelmat
  • Pro gradu -tutkielmat ja diplomityöt sekä syventävien opintojen opinnäytetyöt (kokotekstit) [9587]

Turun yliopiston kirjasto | Turun yliopisto
julkaisut@utu.fi | Tietosuoja | Saavutettavuusseloste
 

 

Tämä kokoelma

JulkaisuajatTekijätNimekkeetAsiasanatTiedekuntaLaitosOppiaineYhteisöt ja kokoelmat

Omat tiedot

Kirjaudu sisäänRekisteröidy

Turun yliopiston kirjasto | Turun yliopisto
julkaisut@utu.fi | Tietosuoja | Saavutettavuusseloste