mlops là gì
Image credit: blogs.nvidia.com

MLOps, từ ghép của Máy học (machine learning) và Hoạt động công nghệ thông tin (information technology operations), là một ngành học mới hơn liên quan đến sự hợp tác giữa các nhà khoa học dữ liệu và các chuyên gia CNTT với mục đích tạo ra các thuật toán máy học. Theo Cognilytica, thị trường cho các giải pháp như vậy có thể tăng từ 350 triệu USD lên 4 tỷ USD vào năm 2025. Nhưng một số sắc thái nhất định có thể khiến việc triển khai MLOps trở thành một thách thức. Một cuộc khảo sát của NewVantage Partners cho thấy chỉ có 15% doanh nghiệp hàng đầu đã triển khai AI vào sản xuất ở mọi quy mô.

Tuy nhiên, không thể bỏ qua giá trị kinh doanh của MLOps. Một chiến lược dữ liệu mạnh mẽ cho phép các doanh nghiệp ứng phó với những hoàn cảnh thay đổi, một phần bằng cách thường xuyên xây dựng và thử nghiệm các công nghệ học máy và đưa chúng vào sản xuất. MLOps về cơ bản nhằm nắm bắt và mở rộng các thực tiễn hoạt động trước đây đồng thời mở rộng các thực tiễn này để quản lý những thách thức duy nhất của học máy.

MLOps là gì?

MLOps, là sự kết hợp của DevOps, kỹ thuật dữ liệu và học máy, tương tự như DevOps nhưng khác về cách thực thi. MLOps kết hợp các bộ kỹ năng khác nhau: của các nhà khoa học dữ liệu chuyên về thuật toán, toán học, mô phỏng và các công cụ dành cho nhà phát triển và của các quản trị viên hoạt động tập trung vào các nhiệm vụ như nâng cấp, triển khai sản xuất, quản lý tài nguyên và dữ liệu cũng như bảo mật.

Một mục tiêu của MLOps là triển khai các mô hình và thuật toán mới một cách liền mạch, không gây ra thời gian chết. Vì dữ liệu sản xuất có thể thay đổi do các sự kiện không mong muốn và mô hình học máy phản ứng tốt với các tình huống đã thấy trước đó, việc đào tạo lại thường xuyên – hoặc thậm chí đào tạo trực tuyến liên tục – có thể tạo ra sự khác biệt giữa dự đoán tối ưu và dự đoán dưới tối ưu (optimal and suboptimal prediction).

Một MLOps software stack điển hình có thể trải dài các nguồn dữ liệu và các tập dữ liệu được tạo từ chúng, cũng như một kho lưu trữ các mô hình AI được gắn thẻ với lịch sử và thuộc tính. Các tổ chức có hoạt động MLOps cũng có thể có các đường ống tự động quản lý bộ dữ liệu, mô hình, thử nghiệm và software container – thường dựa trên Kubernetes – để làm cho việc chạy các công việc này trở nên đơn giản hơn.

Tại Nvidia, các nhà phát triển đang thực hiện công việc trên cơ sở hạ tầng nội bộ phải thực hiện kiểm tra để đảm bảo họ tuân thủ các phương pháp hay nhất của MLOps. Đầu tiên, mọi thứ phải chạy trong một container để hợp nhất các thư viện và thời gian chạy cần thiết cho các ứng dụng AI. Các jobs cũng phải khởi chạy các container với cơ chế đã được phê duyệt và chạy trên nhiều máy chủ, cũng như hiển thị dữ liệu hiệu suất để lộ ra các nút thắt cổ chai tiềm ẩn.

Một công ty khác áp dụng MLOps, công ty khởi nghiệp phần mềm GreenStream, kết hợp quản lý mã phụ thuộc và thử nghiệm mô hình học máy vào quy trình phát triển của mình. GreenStream tự động hóa việc đào tạo và đánh giá mô hình, đồng thời thúc đẩy một phương pháp triển khai và phục vụ nhất quán cho từng mô hình trong khi vẫn giữ cho con người luôn cập nhật.

Triển khai MLOps

Với tất cả các yếu tố liên quan đến MLOps, không có gì ngạc nhiên khi các công ty áp dụng MLOps thường gặp phải những trở ngại. Các nhà khoa học dữ liệu phải điều chỉnh các tính năng khác nhau – như siêu tham số, tham số và mô hình – trong khi quản lý codebase để có kết quả có thể tái tạo. Họ cũng cần tham gia vào việc xác nhận mô hình, ngoài các thử nghiệm mã thông thường, bao gồm kiểm thử đơn vị và kiểm thử tích hợp. Và họ phải sử dụng quy trình nhiều bước để đào tạo lại và triển khai một mô hình – đặc biệt nếu có nguy cơ giảm hiệu suất.

Khi xây dựng chiến lược MLOps, chúng ta nên bắt đầu bằng cách đóng khung các mục tiêu học máy từ các mục tiêu tăng trưởng kinh doanh. Các mục tiêu này, thường ở dạng KPI, có thể có các thước đo hiệu suất nhất định, ngân sách, yêu cầu kỹ thuật, v.v. Từ đó, các tổ chức có thể làm việc để xác định dữ liệu đầu vào và các loại mô hình để sử dụng cho dữ liệu đó. Tiếp theo là chuẩn bị và xử lý dữ liệu, bao gồm các nhiệm vụ như làm sạch dữ liệu và chọn các tính năng có liên quan (tức là các biến được mô hình sử dụng để đưa ra dự đoán).

Không thể phóng đại tầm quan trọng của việc lựa chọn và chuẩn bị dữ liệu. Trong một cuộc khảo sát gần đây của Atlation (một công ty hàng đầu về Data Inteligence), phần lớn nhân viên cho rằng vấn đề chất lượng dữ liệu là lý do khiến tổ chức của họ không triển khai thành công AI và học máy. 87% các chuyên gia cho biết những thành kiến ​​cố hữu trong dữ liệu đang được sử dụng trong hệ thống AI của họ tạo ra các kết quả không công bằng. Từ đó tạo ra rủi ro tuân thủ (compliance risks) cho tổ chức của họ.

Ở giai đoạn này, MLOps mở rộng sang đào tạo và thử nghiệm mô hình. Các khả năng như kiểm soát phiên bản có thể giúp theo dõi dữ liệu và chất lượng mô hình khi chúng thay đổi trong suốt quá trình thử nghiệm, cũng như giúp mở rộng mô hình trên các kiến ​​trúc phân tán. Sau khi các đường ống học máy được xây dựng và tự động hóa, việc triển khai vào sản xuất có thể được tiến hành, sau đó là giám sát, tối ưu hóa và bảo trì các mô hình.

Một phần quan trọng của các mô hình giám sát là quản trị, ở đây có nghĩa là thêm các biện pháp kiểm soát để đảm bảo các mô hình thực hiện đúng trách nhiệm của họ. Một nghiên cứu của Capgemini cho thấy các tổ chức thực hành AI có đạo đức có lòng trung thành cao hơn từ nhân viên, được khách hàng ủng hộ giúp kinh doanh tốt hơn – và những tổ chức không làm như vậy sẽ có kết quả ngược lại. Nghiên cứu cho thấy các công ty không tiếp cận vấn đề một cách chu đáo có thể phải chịu cả rủi ro về danh tiếng và ảnh hưởng trực tiếp đến lợi nhuận của họ.

Lợi ích của MLOps

Tóm lại, MLOps áp dụng cho toàn bộ vòng đời của máy học, bao gồm thu thập dữ liệu, tạo mô hình, điều phối, triển khai, sức khỏe, chẩn đoán, quản trị và các chỉ số kinh doanh. Nếu được thực hiện thành công, MLOps có thể mang lại lợi ích kinh doanh cho các dự án AI trong khi cho phép các nhà khoa học dữ liệu làm việc với định hướng rõ ràng và các tiêu chuẩn có thể đo lường được.

Các doanh nghiệp bỏ qua MLOps làm như vậy sẽ gặp nguy hại cho riêng họ. Thiếu hụt các nhà khoa học dữ liệu có kỹ năng phát triển ứng dụng và thật khó để theo kịp các mục tiêu kinh doanh đang phát triển – một thách thức càng trở nên trầm trọng hơn do khoảng cách giao tiếp. Theo một cuộc khảo sát năm 2019 của IDC, sự thiếu hụt kỹ năng và những kỳ vọng không thực tế từ ban lãnh đạo cấp cao là những lý do hàng đầu dẫn đến thất bại trong các dự án máy học. Vào năm 2018, Element AI ước tính rằng trong số 22.000 nhà nghiên cứu có trình độ Tiến sĩ đang làm việc trên toàn cầu về phát triển và nghiên cứu AI, chỉ có 25% là “đủ thông thạo về công nghệ để làm việc với các nhóm để đưa nó từ nghiên cứu sang ứng dụng”.

Ngoài ra, còn có một thực tế là các mô hình thường đi lệch hướng so với những gì họ dự định đạt được. Đánh giá rủi ro của những thất bại này như một phần của MLOps là một bước quan trọng không chỉ cho các mục đích quản lý mà còn để bảo vệ khỏi các tác động kinh doanh. Ví dụ: chi phí của một đề xuất video không chính xác trên YouTube sẽ thấp hơn nhiều so với việc gắn cờ một người vô tội vì gian lận và khóa tài khoản của họ hoặc từ chối đơn đăng ký vay của họ.

Ưu điểm của MLOps là nó đặt các nhóm vận hành lên hàng đầu về các phương pháp hay nhất trong một tổ chức. Sự tắc nghẽn do các thuật toán học máy giảm bớt nhờ sự phân chia chuyên môn và cộng tác thông minh hơn từ các nhóm vận hành và dữ liệu, đồng thời MLOps sẽ thắt chặt vòng lặp đó.

Nguồn bài viết: https://venturebeat.com/2021/05/07/harnessing-the-power-of-machine-learning-with-mlops/

Đánh giá bài viết

Average rating 5 / 5. Vote count: 1

No votes so far! Be the first to rate this post.

Comments are closed.