Přehled toho, co jsem zatím páchal v eRku
Pro práci s objemnými datovými sadami získanými z proteomiky (a ostatně jakékoli jiné -omiky) je R ideální.
Nejde jen o to, že spousta knihoven pro analýzu vizualizaci konkrétními statistickými metodami (mixOmics, EnrichPathway), práci s bioinformatickými databázemi (BiomaRt) nebo hezkou vizualizaci (pheatmap) je volně k dispozici, ale po letech stupidní debilitující práce se spreadsheety je napsat si kód pro nějakou dplyrovskou operaci něco jako vylézt z jeskyně umazaný od krve, umýt se mýdlem, oholit se a obléct si bavlněné oblečení. A dát si vizuálně hezké jídlo.
A kafe.
Na svůj Github jsem umístil nějaké kódy v R, které můžou posloužit jako vodítko, nebo být přímo využité pro proteomické analýzy a metaanalýzy. Do značné míry jsou využitelné i pro expresní transkriptomická data.
https://github.com/hwllffrdd/proteomics
Zatím tu najdete:
- Comparison pro srovnání a korelaci dvou nezávislých kvantitativních proteomických datasetů
- Proteodata pro tvorbu volcano plotu
- Correlation pro srovnání a korelaci proteomického a transkriptomického datasetu
- sPLS-DA-PCA pro analýzu proteomických dat metodami sPLS-DA a PCA