Přehled toho, co jsem zatím páchal v eRku

Pro práci s objemnými datovými sadami získanými z proteomiky (a ostatně jakékoli jiné -omiky) je R ideální.

Nejde jen o to, že spousta knihoven pro analýzu vizualizaci konkrétními statistickými metodami (mixOmics, EnrichPathway), práci s bioinformatickými databázemi (BiomaRt) nebo hezkou vizualizaci (pheatmap) je volně k dispozici, ale po letech stupidní debilitující práce se spreadsheety je napsat si kód pro nějakou dplyrovskou operaci něco jako vylézt z jeskyně umazaný od krve, umýt se mýdlem, oholit se a obléct si bavlněné oblečení. A dát si vizuálně hezké jídlo.

A kafe.

Na svůj Github jsem umístil nějaké kódy v R, které můžou posloužit jako vodítko, nebo být přímo využité pro proteomické analýzy a metaanalýzy. Do značné míry jsou využitelné i pro expresní transkriptomická data.

https://github.com/hwllffrdd/proteomics

Zatím tu najdete:

  • Comparison pro srovnání a korelaci dvou nezávislých kvantitativních proteomických datasetů
  • Proteodata pro tvorbu volcano plotu
  • Correlation pro srovnání a korelaci proteomického a transkriptomického datasetu
  • sPLS-DA-PCA pro analýzu proteomických dat metodami sPLS-DA a PCA