COVID - 19 Outbreak Prediction using Machine Learning | Machine Learning Training | Edureka
愛立信(Ericsson)的數百名志願者齊聚一堂,共同應對 COVID-19 開放研究數據集挑戰。 為此,他們正在採購和建構重要的數據集,以幫助世界找到當前應對冠狀病毒最嚴峻挑戰的答案。 在下面了解有關他們及其工作的更多資訊。
挑戰 CORD-19 數據集,其中包含數以萬計的研究論文。它正在迅速發展-比任何研究人員都能閱讀和消化的速度更快。面臨的挑戰是建立工具,以幫助醫學研究人員,提取所需的資訊,即使有更多資訊繼續發布。
3月16日星期一,在美國白宮與美國國立衛生研究院,和喬治敦大學一起,發布了 CORD-19 數據集,並發出了行動號召。
在短短幾天內,來自愛立信的 362 多人,舉手並表示願意參加。志願者包括數據科學家、數據工程師、數據可視化工具專案經理、任務經理、領導者和作家。
挑戰分為九大任務,和多個子任務。所有志願者都被分成了較小的小組,負責子任務。此外,所有工作實際上都在進行中。
九大任務包括:
.對傳播、孵化和環境穩定性了解多少?
.我們對 COVID-19 危險因素了解多少?
.我們對病毒的遺傳學,起源和進化了解多少?
.關於研究的倫理學考慮,已經發表了什麼?
.我們對非藥物干預的有效性了解多少?
.我們對診斷和監視了解多少?
.關於醫療保健的什麼出版物?
.關於信息共享和跨部門合作的出版物已經發表?
.我們對疫苗和治療劑了解多少?
讓我們結識一些人,他們自願花時間來完成上面的一些任務,並了解他們的工作:
從公共衛生監督的角度來看,有什麼出版物?
Nikhil Korati Prasanna 在 GAIA 擔任數據科學家。他的日常工作涉及空間異常檢測、電腦視覺、知識圖和自然語言處理機器學習。
他與他的團隊一起,正在從公共衛生監視的角度,幫助弄清關於診斷的已發表論文。透過這樣做,Nikhil 希望能夠預測臨床結果。該小組還試圖從研究中提取數據,以確定當前暴露程度如何,以指導有關緩解措施的政策建議。
具體來說,他們正在建立一個模型,以學習文獻對國家指導,和最佳實踐指南的說法,例如各州如何利用大學和私人實驗室進行測試。該小組還試圖了解有關,如何與公共衛生官員和公眾交流有關情況的文獻。
為此,Nikhil 的小組正在研究文本摘要,以從大量文章中找到相關數據,然後開發分類模型,根據已發表的文章,預測陽性和陰性的臨床結果。
他們開發的工具將提供最新數據,甚至將更多文章添加到數據集中,包括各種診斷方法,和受影響的人口統計學。 Nikhil 希望在醫學研究人員和公共衛生官員的手中,他的團隊的工作,將帶來更加積極的臨床成果。
我們對正在開發的抗冠狀病毒藥物了解多少?
愛立信軟體開發人員埃米特·摩爾(Emmett Moore)領導著一個團隊,該團隊正在數據庫中,尋找有關疫苗和治療劑的資訊,例如了解正在研發的,抗病毒藥物的有效性和風險。
他的團隊首先集思廣益,對一組關鍵詞,詞組和主題進行了集思廣益,以作為他們在解析文獻時,試圖找出哪些文章,與他們要回答的問題相關的基礎。
埃米特說:「由於我們很少有醫學或製藥專業背景,這被證明很有趣。例如,如果我們試圖查找有關疫苗的論文,那麼會出現哪些單詞或短語?我們希望這將有助於我們丟棄所有題外的論文,並為我們提供更小的數據集。」
同時,團隊中的數據可視化人員,正在研究如何最好地展示團隊的發現。例如,他們可能會使用詞雲,或更簡單的相關論文摘要,來證明關鍵發現。
埃米特(Emmett)希望他的團隊,能夠為醫學研究人員提供幫助,幫助他們研究治療和預防 COVID-19 的話題。由於該數據集包含數以萬計的全文,並且還在繼續成長,因此一個人甚至一大群研究人員,都不可能全部閱讀。埃米特(Emmett)樂觀地認為,諸如機器學習之類的新技術確實可以使社會受益。
關於醫療和 COVID-19 的出版物已經發表?
前英語和寫作老師貝基·普林斯(Becky Prince)現在是一名技術作家。 Becky的小組被分配了任務八,該任務將探討有關醫療和 COVID-19 的已發佈內容。
她的團隊中的數據科學家和數據工程師,目前正在產生想法,並測試各種編碼算法。 貝基的工作是記錄他們的發現。 提交的內容將分為三個類別:準確性、文檔和演示文稿。 每個類別最多有 5 分。 因此,文檔和演示文稿是提交內容的重要組成部分。
貝基希望她的團隊的工作所帶來的影響,將是幫助研究人員更快速,更輕鬆地存取他們所需的特定數據,因為這些數據與抗 COVID-19 的醫療保健有關。
我們如何回答,諸如潛伏期以及病毒的傳染性之類的問題?
Manjeet Attri 是渥太華的一名開發商。 Manjeet 擁有阿爾伯塔大學的科學碩士學位,並且還在印度的愛立信工作了兩年多。在他的團隊中,他的工作是測試、驗證和解決測試用例。
他的團隊的任務,是找到潛伏期範圍,個人具有傳染性的時間,以及病毒的傳播方式的答案。他的團隊開始透過選擇最相關的數據,來使龐大的數據集變得較小,從而使其易於掌握。 Manjeet 負責最終報告,並且已經準備了報告大綱。該大綱將為數據科學家和工程師,提供一個明確的目標。
Manjeet說:「我們正在重新整理數千篇研究論文,以幫助醫療專業人員透過查看我們的答案,在幾秒鐘內找到他們問題的答案。」
我們透過給參與者希望帶來勝利
我對挑戰的反應,和志願者已經完成的工作不知所措。我認為我們可能會招募 20 名志願者,也許有 30 名志願者。相反,我們現在有 360 多個。我們正在努力建構一個結構,以便每個志願者都知道,他們在做什麼,以及與誰在一起工作。我們還嘗試創建資訊流的流程,以便我們共享最佳實踐。
如果我們成功,我們將幫助醫生和公共衛生從業人員獲取關鍵資訊。這可以幫助挽救生命,並減少 COVID-19 對社會和我們社區的影響。這給了參與者希望,在這樣的時代非常重要。對我來說,這就是我們贏得這場比賽的方式。
閱讀更多
要詳細瞭解愛立信,對冠狀病毒大流行的反應,請閱讀我們首席執行官的博客文章:愛立信如何應對冠狀病毒
沒有留言:
張貼留言