用DNA直接存儲圖像,「活細胞相機」分辨率達96像素
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
DNA可以用來拍照了,而且是直接存進去的那種!
新加坡國立大學的研究團隊成功將圖像投影到DNA上并進行了存儲,分辨率達到了96像素。
甚至,利用同一段DNA序列,還能存儲多張!

傳統的DNA存儲需要從頭開始構建DNA序列,并通過人工合成的方式編碼。
但這一成果直接使用從大腸桿菌中提取到的DNA,將圖像轉換成DNA數字信號的編碼器也是活細胞。
于是,通過將細菌(Bacteria)和照相機(Camera)結合,團隊把這一成果命名為BacCam。
BacCam不僅將DNA存儲的效率大大提高,還具有極強的魯棒性,常見的一些特殊環境都能耐受。
相關論文已經登上了Nature子刊。

英偉達AI科學家范麟熙(Jim Fan)也轉發了這一成果。
雖然我不是生物學專家,但我很期待看到生物和機器之間的無縫銜接。我已經迫不及待地想要把大語言模型(LLM)掛載到「生物API」上了!

無懼水深火熱
實驗中,BacCam展現出了極強的魯棒性。
對于其中一張圖像,將DNA稀釋5萬倍之后,數據沒有受到絲毫影響。
稀釋后的DNA濃度只有0.36皮(10-12)摩爾每升,比在水池中放一粒沙子還要低上那么幾個數量級。

不過,稀釋對DNA分子本身影響不大,可能還不足以說明問題。
但將溶液烘干之后復原,熟悉的笑臉依舊清晰可見。

對于復雜的外部環境條件,BacCam也能輕松應對。
除了在室溫條件下能保持完好之外,冷凍和加熱也都對數據沒有什么影響。
在60度的烘箱當中放上一周,圖像仍然完好無損,不過70度就不行了。
但據論文中介紹,把DNA在70度環境下放上一周,相當于在9.4度下放兩千年。
就算用紫外線照上一個小時,里面的數據依舊巋然不動。

而對于存儲不同圖像的DNA,也無需分別進行保存,直接混在一起就可以了。
將不同DNA混合后,讀取時,只需要使用特定引物,對需要的部分進行擴增。
團隊將5段存儲不同圖像的DNA混在了一起,結果單次讀取時圖像幾乎能保持完整,多次隨機讀取的最低準確率也有80%。

△B行為單次讀取,C行為多次隨機讀取
既然如此,它是如何做到的呢?
點陣化方式處理
BacCam大致的工作流程是醬嬸兒的:
首先,要存儲的圖像被分割成96個區域。
然后,利用對特定波長光線敏感的反應重組酶,根據該波長光的有無,對DNA進行編輯。

這種“條形碼”式的編輯方式直接保留了圖像中各像素點的空間位置,使圖像數字化,而不需要額外進行編碼。
此外,利用光的復用能力和對不同波長敏感的酶,團隊將正交的紅藍兩種顏色圖像分層,實現了用同一段序列存儲兩個圖像。

這種存儲方式下,BacCam依舊擁有很高的準確率。

利用機器學習方式,研究團隊對BacCam的解碼方式進行了優化。
經過大量的無監督式學習,已經實現了DNA編碼的自動化解讀。

團隊簡介
BacCam的研究團隊來自新加坡國立大學EngBio實驗室。
該實驗室主要進行以生物學為核心的多學科交叉工程研究。
論文第一作者是來自該實驗室的華人博士生Cheng Kai Lim。
他的研究方向是利用DNA進行數據存儲,同時還在攻讀MBA學位。
Lim的導師、實驗室負責人Chueh Loo Poh教授是本文的通訊作者。
論文地址:https://www.nature.com/articles/s41467-023-38876-w






























