Báo cáo trong Tableau thường chậm hơn so với BI Publisher do sự khác biệt về kiến trúc, cách thức xử lý dữ liệu, và mục đích sử dụng của từng công cụ. Hãy cùng tìm hiểu những lý do chính dẫn đến sự khác biệt về hiệu suất giữa hai công cụ này. 1….
Danh mục: Data Engineer
CDS (Card Data System) là gì?
Trong ngành ngân hàng, CDS (Card Data System) thường được sử dụng để quản lý, xử lý và phân tích dữ liệu liên quan đến thẻ thanh toán như thẻ tín dụng, thẻ ghi nợ (debit card), thẻ ATM, và các loại thẻ khác mà ngân hàng phát hành hoặc chấp nhận. Hệ thống CDS…
Data Warehouse (DW), Operational Reporting System (ORS), và Operational Data Store (ODS)
Data Warehouse (DW), Operational Reporting System (ORS), và Operational Data Store (ODS) đều là các hệ thống quản lý và xử lý dữ liệu, nhưng chúng phục vụ các mục đích và yêu cầu khác nhau. DW: Tập trung vào phân tích dài hạn, dữ liệu lịch sử. ORS: Phục vụ báo cáo hoạt động…
Common Table Expression (CTE) trong cơ sở dữ liệu
Common Table Expression (CTE) là một khái niệm trong SQL (Structured Query Language), được sử dụng để định nghĩa một tập hợp các kết quả truy vấn tạm thời, mà có thể được tham chiếu nhiều lần trong cùng một truy vấn chính. CTE thường giúp làm cho các truy vấn phức tạp trở nên…
High Water Mark (HWM) trong cơ sở dữ liệu là gì?
High Water Mark (HWM) trong cơ sở dữ liệu là một khái niệm quan trọng liên quan đến quản lý không gian lưu trữ và hiệu năng của cơ sở dữ liệu, đặc biệt trong các hệ quản trị cơ sở dữ liệu như Oracle, PostgreSQL, và SQL Server. 1. Khái niệm High Water Mark…
TRUNCATE có gây phân mảnh bảng không?
Phân mảnh bảng là gì? Phân mảnh bảng xảy ra khi dữ liệu bị xóa hoặc cập nhật khiến các khoảng trống (gaps) không liên tục trong các khối dữ liệu, làm cho dữ liệu lưu trữ không liền mạch trên ổ đĩa. Điều này ảnh hưởng đến hiệu suất truy xuất dữ liệu. 1….
Phân biệt Index và Partition trong cơ sở dữ liệu
Index và Partition đều là các kỹ thuật trong cơ sở dữ liệu để tối ưu hóa hiệu suất truy vấn, nhưng chúng hoạt động theo những cách khác nhau và được sử dụng với mục đích khác nhau. Dưới đây là sự phân biệt chi tiết: 1. Định nghĩa Index (Chỉ mục): • Là…
Partition được tạo ra và hoạt động như thế nào trong cơ sở dữ liệu?
1. Tạo Partition Khi một bảng được phân vùng (partitioned), hệ thống cơ sở dữ liệu thực hiện các bước sau: a. Xác định chiến lược partitioning • Range Partitioning: Chia dữ liệu thành các dải giá trị. • Hash Partitioning: Dùng hàm băm để phân phối dữ liệu ngẫu nhiên vào các phân vùng….
Partition trong cơ sở dữ liệu là gì?
Partition trong cơ sở dữ liệu là một kỹ thuật dùng để chia nhỏ bảng (table) hoặc chỉ mục (index) thành các phần nhỏ hơn, được gọi là phân vùng (partition). Mỗi phân vùng chứa một phần dữ liệu của bảng và được lưu trữ một cách độc lập trên đĩa. Partition giúp cải thiện…
Bảng bị phân mảnh trong cơ sở dữ liệu nghĩa là gì?
Phân mảnh (Fragmentation) trong cơ sở dữ liệu xảy ra khi dữ liệu trong bảng hoặc chỉ mục không được lưu trữ liên tục trên đĩa. Điều này có thể làm giảm hiệu suất truy vấn vì cơ sở dữ liệu phải đọc dữ liệu từ nhiều vị trí khác nhau, thay vì đọc liên…