Microsoft đang phát triển một công cụ AI mới mang tên SpreadsheetLLM, được thiết kế để tăng cường khả năng phân tích và diễn giải dữ liệu trong các bảng tính. Công cụ này nhằm giải quyết những thách thức mà các mô hình ngôn ngữ lớn (LLM) truyền thống gặp phải khi xử lý các bảng tính, bao gồm việc xử lý lưới dữ liệu hai chiều, bố cục linh hoạt và các tùy chọn định dạng đa dạng. SpreadsheetLLM cải thiện việc này bằng cách tuần tự hóa dữ liệu và tích hợp địa chỉ ô, giá trị và định dạng vào một luồng dữ liệu liền mạch.
Công cụ bao gồm ba mô-đun chính: một mô-đun phân tích cấu trúc bảng tính để loại bỏ nội dung không phù hợp, một mô-đun dịch dữ liệu thành biểu diễn hiệu quả hơn, và một mô-đun tổng hợp dữ liệu. Mặc dù có một số hạn chế như bỏ qua màu nền của ô, điều này có thể quan trọng đối với ý nghĩa của dữ liệu, SpreadsheetLLM đã cho thấy hiệu quả đáng kể trong các thử nghiệm. Nó đã vượt trội hơn các phương pháp truyền thống 25,6% trong bối cảnh học tập theo ngữ cảnh của GPT-4 và giảm 96% lượng mã thông báo cần thiết để mã hóa bảng tính, qua đó giảm chi phí tính toán đáng kể.
Khả năng của SpreadsheetLLM trong việc phát hiện và hiểu các bảng tính là yếu tố quan trọng giúp nó có thể hỗ trợ và thậm chí thay thế một số công việc trong các lĩnh vực như kế toán và phân tích dữ liệu. Công cụ này cũng hỗ trợ người dùng không chuyên thực hiện truy vấn và thao tác dữ liệu thông qua lời nhắc ngôn ngữ tự nhiên, mà không cần sâu về kỹ thuật làm việc với bảng tính.
Mặc dù vậy, SpreadsheetLLM vẫn đang trong giai đoạn nghiên cứu và chưa sẵn sàng để ra mắt thị trường như một sản phẩm thương mại như Microsoft Excel. Sự phát triển của công cụ này cho thấy tiềm năng lớn trong việc cải thiện độ tin cậy và hiệu quả của phân tích dữ liệu được hỗ trợ bởi AI, đặc biệt là trong việc làm việc với dữ liệu có cấu trúc và không có cấu trúc.