新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

<p id="dmzmo"><ins id="dmzmo"><th id="dmzmo"></th></ins></p>

<td id="dmzmo"><tr id="dmzmo"></tr></td>

當前位置： OFweek 人工智能網 > 大數據 > 正文

如何使用TCGAbiolinks進行數據預處理？

2021-01-07 09:31

＃＃＃設置barcodes參數，篩選符合要求的371個腫瘤樣本數據和50正常組織數據

queryDown ＜－ GDCquery（project ＝＂TCGA－LIHC＂，

data．category ＝＂Transcriptome Profiling＂，

data．type ＝＂Gene Expression Quantification＂，

workflow．type ＝＂HTSeq － Counts＂，

barcode ＝ c（dataSmTP， dataSmNT））

＃barcode參數：根據傳入barcodes進行數據過濾

上圖為 queryDown＜－GDCquery（）的結果，僅選擇了選擇371個正常組織和50個腫瘤組織樣本。

第二步：GDCdownload（）下載GDCquery（）得到的結果

＃下載數據，默認存放位置為當前工作目錄下的GDCdata文件夾中。

GDCdownload（queryDown，method ＝＂api＂， directory ＝＂GDCdata＂，

files．per．chunk ＝ 10）

＃method ；＂API＂或者＂client＂。＂API＂速度更快，但是容易下載中斷。

＃directory：下載文件的保存地址。Default： GDCdata。

＃files．per．chunk ＝ NULL：使用API下載大文件的時候，可以把文件分成幾個小文件來下載，可以解決下載容易中斷的問題。

GDCdownload（query ＝ queryDown）

說明：由于小編前面已經下載過該TCGA數據，所以這里顯示的是421個文件已存在。如果還沒有下載的話，可能需要根據自己的網速等待一些時間。

顯示這樣的結果，就算下載成功啦！文件默認保存在 Rstudio默認路徑下的GDCdata中。前面就是我們利用第一期知識進行數據下載環節，權當溫習功課吧——接下來我們就開始此期的數據處理～～

二、數據處理

第三步：GDCprepare（）將前面GDCquery（）的結果準備成R語言可處理的SE（SummarizedExperiment）文件。

＃讀取下載的數據并將其準備到R對象中，在工作目錄生成（save＝TRUE）LIHC＿case．rda文件

＃ GDCprepare（）：Prepare GDC data，準備GDC數據，使其可用于R語言中進行分析

dataPrep1 ＜－ GDCprepare（query ＝ queryDown， save ＝ TRUE， save．filename ＝

＂LIHC＿case．rda＂）

GDCprepare（）中的參數：

參數用法query來自GDCquery的結果save是否將結果保存為RData object，默認為TRUEsave．filename文件名，如果沒有設置，系統將默認設置directory文件數據的文件夾，默認為“GDCdata”summarizedExperiment是否生成summarizedExperiment對象，默認TRUE

第四步：TCGAanalyze＿Preprocessing（）對數據進行預處理：使用spearman相關系數去除數據中的異常值

＃去除dataPrep1中的異常值，dataPrep1數據中含有腫瘤組織和正常組織的數據

＃ TCGAanalyze＿Preprocessing（object， cor．cut ＝ 0， filename ＝ NULL，

width ＝ 1000， height ＝ 1000， datatype ＝ names（assays（object））［1］）

＃函數功能描述：Array Array Intensity correlation （AAIC） and correlation boxplot to define outlier

dataPrep2 ＜－ TCGAanalyze＿Preprocessing（object ＝ dataPrep1，

cor．cut ＝ 0．6，

datatype ＝＂HTSeq － Counts＂）

＃將預處理后的數據dataPrep2，寫入新文件“LIHC＿dataPrep．csv”

write．csv（dataPrep2，file ＝＂LIHC＿dataPrep．csv＂，quote ＝ FALSE）

<上一頁 1 2 3 下一頁>

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯系舉報。

發表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新活動更多

6月30日
立即申請試用>> 【免費試用】旭之源工業電源一一機器人的穩定“心臟“
精彩回顧
立即查看>> 【限時免費】物理場仿真助力生物醫學領域技術創新
精彩回顧
立即查看>> 【直播】智測未來·2026海克斯康春季產品創新日
精彩回顧
立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
精彩回顧
立即查看>> OFweek 2026（第十五屆）中國機器人產業大會
精彩回顧
立即查看>> 維科杯· OFweek 2025中國機器人行業年度評選

一周熱點月點擊榜

企業服務廣告服務獵頭服務薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發工程師福建省/福州市
銷售總監（光器件）北京市/海淀區
激光器高級銷售經理上海市/虹口區
光器件物理工程師北京市/海淀區
激光研發工程師北京市/昌平區
技術專家廣東省/江門市
封裝工程師北京市/海淀區
結構工程師廣東省/深圳市

掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容

文章糾錯

x

_*文字標題：

_*糾錯內容：

聯系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網安備 44030502002758號

<span id="13zdr"></span>