Phòng thí nghiệm Phản lực JPL của NASA và Viện Ung thư Quốc gia Hoa Kỳ vừa gia hạn hợp tác dữ liệu lớn nhằm nỗ lực tìm kiếm giải pháp nâng cao năng lực và hiệu quả chẩn đoán sớm căn bệnh ung thư hoặc nguy cơ ung thư.

Vật Lý Thiên Văn - Chia sẻ niềm đam mê!

NGC 3718, NGC 3729 và các thiên hà khác được phân tích sử dụng các thuật toán tự học của máy tính có thể được "dạy" để nhận dạng sư tương đồng trong vật lý thiên văn. Công nghệ tương tự hiện nay cũng đang được áp dụng đối với các hình ảnh ung thư. Image Credit: Catalina Sky Survey, trường Đại học Arizona, và Catalina Realtime Transient Survey, Caltech.

Mỗi ngày, các tàu vũ trụ của NASA gửi về hàng trăm triệu tỷ byte dữ liệu, tất cả đều phải được hệ thống hóa, lưu trữ và phân phối đến các nhà khoa học trên khắp thế giới. Cùng với đó, trí tuệ nhân tạo cũng đang giúp chúng ta đọc những dữ liệu này, làm nổi bật sự tương đồng giữa các bộ dữ liệu mà các nhà khoa học có thể bỏ lỡ.

Trong suốt 15 năm qua, kỹ thuật dữ liệu lớn (Big Data) tiên phong bởi Phòng thí nghiệm Phản lực (Jet Propulsion Laboratory - JPL) của NASA tại Pasadena, California, đã cách mạng hóa nghiên cứu y sinh học. Ngày 06/9/2016 vừa qua, JPL và Viện Ung thư Quốc gia Hoa Kỳ (National Cancer Institute - NCI), thuộc Viện Y tế Quốc gia, đã gia hạn hợp tác nghiên cứu đến năm 2021, mở rộng sự phát triển của khoa học dữ liệu có nguồn gốc từ việc khám phá không gian và hiện nay đang hỗ trợ cho các phát hiện ung thư mới.

Mạng lưới Nghiên cứu Phát hiện sớm (Early Detection Research Network - EDRN) được hỗ trợ bởi NCI là một tổ hợp các nhà nghiên cứu y sinh học chia sẻ dữ liệu ẩn danh dựa trên chỉ dấu sinh học, hóa học hay ký hiệu gen ung thư có liên quan đến từng bệnh ung thư cụ thể. Mục tiêu của họ là gộp chung tất cả dữ liệu nghiên cứu vào trong một mạng lưới đơn nhất có thể tìm kiếm dễ dàng, với mục tiêu biên dịch công việc tập thể của họ vào trong các kỹ thuật để chẩn đoán sớm ung thư hoặc nguy cơ ung thư.

Trong thời gian họ làm việc với nhau, các nỗ lực của JPL và EDRN đã giúp phát hiện sáu loại dược phẩm và thực phẩm chỉ dấu sinh học ung thư mới đã được phê duyệt chính thức, và chín chỉ dấu sinh học được phê duyệt để sử dụng trong các phòng thí nghiệm lâm sàng. Cơ quan quản lý Thực phẩm và Dược phẩm Hoa Kỳ đã phê duyệt từng loại chỉ dấu sinh học này được sử dụng trong nghiên cứu và chẩn đoán ung thư. Những chỉ dấu sinh học đã được phê duyệt chính thức này đã được sử dụng trong xét nghiệm chẩn đoán hơn 1 triệu bệnh nhân trên toàn thế giới.

"Sau khi thành lập EDRN năm 2000, mạng lưới đã cần đến các chuyên gia để lấy dữ liệu từ nhiều nghiên cứu về chỉ dấu sinh học ung thư và tạo ra một mạng lưới tìm kiếm đơn nhất dành cho các nhà khoa học", theo lời Sudhir Srivastava, giám đốc Nhóm Nghiên cứu Chỉ dấu sinh học Ung thư của NCI và là người đứng đầu của EDRN. JPL có nhiều thập kỷ kinh nghiệm làm công việc tương tự cho NASA, nơi các tàu vũ trụ truyền hàng trăm triệu tỷ byte dữ liệu để mã hóa, lưu trữ và phân phối đến các nhà khoa học trên toàn cầu.

Dan Crichton, người đứng đầu Trung tâm Khoa học và Công nghệ Dữ liệu của JPL, một sáng kiến chung với Viện Caltech ở Pasadena, California, đã giúp thiết lập trung tâm thông tin JPL dành riêng cho việc hỗ trợ các nỗ lực dữ liệu lớn của EDRN. Trong quan hệ đối tác mới được gia hạn, JPL đang mở rộng các nỗ lực khoa học dữ liệu của mình để nghiên cứu và áp dụng công nghệ cho chương trình bổ sung được tài trợ bởi NCI. Các chương trình đó bao gồm EDRN, Tổ hợp Đặc tính Tổn thương Phân tử và Tế bào đã xác định, và sáng kiến Công nghệ Thông tin dành cho Nghiên cứu Ung thư.

"Từ quan điểm của NASA, có những cơ hội rõ ràng để phát triển năng lực khoa học dữ liệu mới có thể hỗ trợ cả hai nhiệm vụ khám phá không gian và nghiên cứu ung thư sử dụng cùng phương pháp tiếp cận", Crichton cho biết. "Chúng ta có một cơ hội tuyệt vời để hoàn thiện các kỹ thuật đó và phát triển các kỹ thuật khoa học dữ liệu của JPL, trong khi phục vụ đất nước của chúng ta".

Crichton cho biết JPL đã đi trước trong việc lấy dữ liệu từ các quan sát thô để đi đến các kết luận khoa học. Lấy một ví dụ, JPL thường đối mặt với các đo đạc từ nhiều loại cảm biến khác nhau - chẳng hạn như các máy ảnh và các máy quang phổ. Cả hai có thể được sử dụng để nghiên cứu một ngôi sao, hành tinh hay các đối tượng tương tự. Nhưng nó cần các phần mềm đặc biệt để nhận ra các ghi chép từ các công cụ rất khác nhau có liên quan đến nhau.

Có một vấn đề tương tự trong nghiên cứu ung thư, nơi các ghi chép từ các xét nghiệm y sinh học hay các công cụ khác nhau cần đến sự tương quan với nhau. Khi điều đó xảy ra, dữ liệu phải được chuẩn hóa, và các thuật toán phải được "dạy" để hiểu được thứ mà nó đang xem xét.

Kể từ khi thành lập, thách thức chủ yếu của EDRN đã được giải quyết. Các trung tâm nghiên cứu trên khắp nước Mỹ có lượng lớn các mẫu chỉ dấu sinh học, nhưng mỗi trung tâm lại có cách riêng để đánh dấu, lưu trữ, và chia sẻ các bộ dữ liệu. Có mười trang web có thể có các mẫu chất lượng cao cho nghiên cứu, nhưng nếu các yếu tố dữ liệu chung của họ - chẳng hạn như tuổi của bệnh nhân, loại ung thư và các đặc tính khác - không được liệt kê một cách thống nhất, họ sẽ không thể nghiên cứu được toàn bộ chúng.

"Chúng tôi không biết chúng là mẫu vật giai đoạn đầu hay giai đoạn cuối, hay bất kỳ mức độ điều trị nào đã được thực hiện", Srivastava cho hay. "Và JPL nói với chúng tôi rằng: Họ đã luôn làm điều này từ trước đến nay! Đó là cách mà họ quản lý hệ thống dữ liệu hành tinh của họ".

Khi mạng lưới này được phát triển, nó sẽ được bổ sung thành viên từ hàng tá các viện nghiên cứu, bao gồm cả Trường Y khoa Geisel của Đại học Dartmouth; Trường Y khoa Harvard của Bệnh viện Đa khoa Massachusetts; Nhóm Đo lường NIST Genome-Scale của Stanford; Trung tâm Ung thư MD Anderson của Đại học Texas; và nhiều viện khác nữa.

Christos Patriotis, giám đốc chương trình tại Nhóm Nghiên cứu Chỉ dấu sinh học Ung thư của NCI, cho biết các thành viên của mạng lưới hiện nay bao gồm cả các nhà nghiên cứu quốc tế đến từ Vương quốc Anh, Trung Quốc, Nhật Bản, Úc, Israel và Chile.

"Càng mở rộng, chúng ta càng có nhiều dữ liệu tích hợp vào", Patriotis cho biết. "Thay vì cất giấu kỹ, thì bây giờ các đối tác của chúng tôi có thể tích hợp các tìm kiếm của họ. Mỗi hệ thống có thể giao tiếp được với nhau".

Khi sự hợp tác giữa JPL và NCI tiến triển, các bước tiếp theo bao gồm công nghệ nhận dạng hình ảnh, chẳng hạn như giúp EDRN lưu trữ các hình ảnh của các mẫu ung thư. Những hình ảnh đó có thể được phân tích bởi máy tính, thứ hiện đang được sử dụng để phát hiện sự tương đồng trong các cụm sao và các nghiên cứu vật lý thiên văn khác.

Theo Crichton, trong tương lai gần, các thuật toán tự học của máy tính có thể so sánh một mẫu quét CT với một kho lưu trữ các hình ảnh tương tự, tìm kiếm các dấu hiệu sớm của ung thư dựa trên độ tuổi của bệnh nhân, nền tảng dân tộc và các nhân khẩu học khác.

"Khi chúng tôi phát triển các phương pháp tự động hóa nhiều hơn cho việc phát hiện và phân loại các đặc trưng trong hình ảnh, chúng tôi thấy cơ hội tuyệt vời để tăng cường khám phá dữ liệu", Crichton cho biết. "Chúng tôi có các ví dụ về các thuật toán phát hiện các đặc trưng trong những hình ảnh thiên văn học được chuyển đổi sang áp dụng cho sinh học và ngược lại".

Các thông tin khác về nghiên cứu này có thể tham khảo tại website: http://edrn.cancer.gov

Nguồn: JPL/NASA