Amazon Web Services (AWS) gần đây đã giới thiệu Amazon DevOps Guru, một trong số các dịch vụ dựa trên máy học. DevOps Guru giúp phát hiện các sự cố tiềm ẩn trong quá trình hoạt động, tạo báo cáo và thông báo, đồng thời cung cấp thông tin chi tiết và đề xuất những gì cần thực hiện.
DevOps Guru là một dịch vụ được quản lý hoàn toàn được đào tạo để phân tích nhật ký, số liệu và sự kiện trên 25 tài nguyên AWS. Dịch vụ này theo dõi các hành vi khác với các mẫu được thiết lập sẵn từ thông tin được trích xuất từ Amazon và AWS. Người dùng định cấu hình DevOps Guru với danh sách tài nguyên cần theo dõi. DevOps Guru sẽ cảnh báo người dùng về các vấn đề và sự cố tiềm ẩn khi xác định các tình huống bất thường, chẳng hạn như việc phát hành mã dẫn đến hành vi bất thường hoặc các kiểu sử dụng có thể dẫn đến hết tài nguyên.
DevOps Guru cung cấp thông tin chi tiết bao gồm tác động của các vấn đề cũng như cách khắc phục chúng.
Theo giám đốc điều hành AWS, Andy Jassy, cho biết hệ thống sử dụng công nghệ máy học sử dụng dữ liệu có được từ hoạt động nhiều năm của Amazon và AWS. DevOps Guru là sự khởi điểm của Amazon trong lĩnh vực MLOps. Theo Jassy, DevOps Guru xác định các vấn đề đối với việc tính toán, báo động các cấu hình sai và rò rỉ bộ nhớ.
DevOps Guru cung cấp cho người dùng một trang tổng quan (dashboard) tích hợp với một trang thông tin chi tiết hiển thị những điểm bất thường mà trang này phát hiện ra. Dịch vụ trình bày các báo cáo này với thông tin theo ngữ cảnh và các khuyến nghị về cách giải quyết chúng. Thông tin chi tiết có thể phản ứng, làm nổi bật các vấn đề hiện có hoặc chủ động, xác định các vấn đề có thể xảy ra trong tương lai. Ví dụ: một thông tin chi tiết mang tính phản ứng sẽ cảnh báo các nhà phát triển về sự gia tăng đột ngột về độ trễ trong một hàm lambda. Hoặc cảnh báo cho các nhà phát triển về sự gia tăng độ trễ dự kiến do việc sử dụng bộ nhớ tăng lên trong cùng một chức năng.
Dịch vụ cung cấp Thông tin chi tiết qua các sự kiện SNS và đã có thể gửi cảnh báo qua PagerDuty và Atlassian’s Opsgenie. DevOps Guru cũng tích hợp với AWS Systems Manager để tạo các OpsItems mới trong OpsCenter và tạo các Sự kiện Cloudwatch.
DevOps Guru không tính phí theo tháng hoặc theo dịch vụ gọi. Đổi lại, Amazon tính phí phân tích tài nguyên AWS và các lệnh gọi API. Phí được tính theo giờ cho mỗi tài nguyên hoạt động. Tài nguyên đang hoạt động nếu nó tạo ra các sự kiện, log entries hoặc chỉ số trong vòng một giờ.
Dịch vụ hiện có sẵn dưới dạng bản xem trước miễn phí ở các khu vực AWS ở Mỹ (N. Virginia, Ohio, Oregon), Châu Âu (Ireland) và Châu Á Thái Bình Dương (Tokyo).
Theo infoq.com