AWS Quicksight chấp nhận dữ liệu từ nhiều nguồn khác nhau. Khi bạn nhấp vào “Tập dữ liệu mới” trên trang chủ, nó cung cấp cho bạn các tùy chọn về tất cả các nguồn dữ liệu có thể được sử dụng. Dưới đây là các nguồn chứa danh sách tất cả các nguồn bên trong và bên ngoài
kết nối Quicksight với một số nguồn dữ liệu được sử dụng phổ biến nhất –
Tải lên tệp từ hệ thống
Nó chỉ cho phép bạn nhập các tệp định dạng .csv, .tsv, .clf, .elf.xlsx và Json. Sau khi bạn chọn tệp, Quicksight sẽ tự động nhận dạng tệp và hiển thị dữ liệu. Khi bạn nhấp vào nút Tải lên tệp , bạn cần cung cấp vị trí của tệp mà bạn muốn sử dụng để tạo tập dữ liệu.
Sử dụng tệp từ định dạng S3
Màn hình sẽ xuất hiện như bên dưới. Trong Tên nguồn dữ liệu, bạn có thể nhập tên được hiển thị cho tập dữ liệu sẽ được tạo. Ngoài ra, bạn sẽ yêu cầu tải lên tệp kê khai từ hệ thống cục bộ của mình hoặc cung cấp vị trí S3 của tệp kê khai.
Tệp kê khai là tệp định dạng json, chỉ định url / vị trí của tệp đầu vào và định dạng của chúng. Bạn có thể nhập nhiều tệp đầu vào, miễn là định dạng giống nhau. Đây là một ví dụ về tệp kê khai. Tham số “URI” được sử dụng để chuyển vị trí của tệp đầu vào là S3.
{
"fileLocations": [
{
"URIs": [
"url of first file",
"url of second file",
"url of 3rd file and so on"
]
},
],
}
"globalUploadSettings": {
"format": "CSV",
"delimiter": ",",
"textqualifier": "'",
"containsHeader": "true"
}
Các tham số được truyền trong globalUploadSettings là những tham số mặc định. Bạn có thể thay đổi các thông số này theo yêu cầu của bạn.
MySQL
Bạn cần nhập thông tin cơ sở dữ liệu vào các trường để kết nối với cơ sở dữ liệu của mình. Sau khi nó được kết nối với cơ sở dữ liệu của bạn, bạn có thể nhập dữ liệu từ nó
Thông tin sau là bắt buộc khi bạn kết nối với bất kỳ cơ sở dữ liệu RDBMS nào –
- Tên DSN
- Loại kết nối
- Tên máy chủ cơ sở dữ liệu
- Tên cơ sở dữ liệu
- Tên tài khoản
- Mật khẩu
Các nguồn dữ liệu dựa trên RDBMS sau được hỗ trợ trong Quicksight –
- Amazon Athena
- Amazon-Aurora
- Amazon Redshift
- Amazon S3
- Phân tích Amazon S3
- Apache Spark 2.0 trở lên
- MariaDB 10.0 trở lên
- Microsoft SQL Server 2012 trở lên
- MySQL 5.1 trở lên
- PostgreSQL 9.3.1 trở lên
- Presto 0.167 trở lên
- Teradata 14.0 trở lên
Athena
Athena là công cụ AWS để chạy các truy vấn trên bảng. Bạn có thể chọn bất kỳ bảng nào từ Athena hoặc chạy một truy vấn tùy chỉnh trên các bảng đó và sử dụng kết quả của các truy vấn đó trong Quicksight. Có một số bước để chọn nguồn dữ liệu Khi bạn chọn Athena, màn hình bên dưới sẽ xuất hiện. Bạn có thể nhập bất kỳ tên nguồn dữ liệu nào mà bạn muốn cấp cho nguồn dữ liệu của mình trong Quicksight. Nhấp vào “Xác thực kết nối” . Sau khi kết nối được xác thực, hãy nhấp vào nút “ Tạo nguồn mới”
Bây giờ chọn tên bảng từ menu thả xuống. Menu thả xuống sẽ hiển thị các cơ sở dữ liệu hiện có trong Athena, sẽ hiển thị thêm các bảng trong cơ sở dữ liệu đó. Nếu không, bạn có thể nhấp vào “Sử dụng SQL tùy chỉnh” để chạy truy vấn trên bảng Athena.
Sau khi hoàn tất, bạn có thể nhấp vào “Chỉnh sửa / Xem trước dữ liệu” hoặc “Hình ảnh hóa” để chỉnh sửa dữ liệu của bạn hoặc trực quan hóa dữ liệu theo yêu cầu của bạn.
Xóa nguồn dữ liệu
Khi bạn xóa nguồn dữ liệu đang được sử dụng trong bất kỳ trang tổng quan Quicksight nào, điều đó có thể làm cho tập dữ liệu được liên kết không sử dụng được. Nó thường xảy ra khi bạn truy vấn nguồn dữ liệu dựa trên SQL.
Khi bạn tạo tập dữ liệu dựa trên S3, Lực lượng bán hàng hoặc SPICE , điều đó không ảnh hưởng đến khả năng sử dụng bất kỳ tập dữ liệu nào của bạn vì dữ liệu được lưu trữ trong SPICE; tuy nhiên tùy chọn làm mới không khả dụng trong trường hợp này. Để xóa nguồn dữ liệu, hãy chọn nguồn dữ liệu. Điều hướng đến tab Từ nguồn dữ liệu hiện có khi tạo trang tập dữ liệu.
Trước khi xóa, bạn cũng có thể xác nhận kích thước bảng ước tính và các chi tiết khác của nguồn dữ liệu.
Khi bạn sử dụng các nguồn dữ liệu khác nhau trong công cụ Quicksight, sẽ có những giới hạn nhất định áp dụng dựa trên nguồn dữ liệu.
Tập tin
Bạn có thể sử dụng tối đa 25GB tổng kích thước được chỉ định trong tệp kê khai. Giới hạn này phụ thuộc vào kích thước tệp sau khi nó được nhập vào SPICE.
Số lượng tệp được hỗ trợ trong tệp kê khai là 1000 và bạn cũng có một số giới hạn về số cột trong mỗi tệp.
Bảng và Truy vấn
Khi bạn đang truy vấn một bảng lớn, bạn nên sử dụng Điều kiện ở đâu hoặc Có để giảm số lượng dữ liệu được nhập vào SPICE. Kết quả truy vấn được nhập vào SPICE không được vượt quá 25 GB.
Bạn có thể bỏ chọn một số cột trong khi nhập dữ liệu vào SPICE.
Trong trường hợp nguồn dữ liệu của bạn chứa loại dữ liệu không được hỗ trợ trong Quicksight, AWS Quicksight sẽ bỏ qua các giá trị đó.
Person ID | Sales Date | Amount |
001 | 10/14/2017 | 12.43 |
002 | 5/3/2017 | 25.00 |
003 | Unknown | 18.17 |
004 | 3/8/2019 | 86.02 |
From the above values, Quicksight will drop the no date value row while importing this data in dataset. Following data types are supported in Quicksight −
Database Source | Number Data Types | String Data Types | Date time Data Types | Boolean Data Types |
Amazon Athena,Presto | bigint decimal double integer real smallint tinyint | char varchar | date timestamp | Boolean |
Amazon Aurora, MariaDB,and MySQL | bigint decimal double int integer mediumint numeric smallint tinyint | char enum set text varchar | date datetime timestamp year | |
PostgreSQL | bigint decimal double integer numeric precision real smallint | char character text varchar varying character | date timestamp | Boolean |
Apache Spark | bigint decimal double integer real smallint tinyint | varchar | date timestamp | Boolean |
Snowflake | bigint byteint decimal double doubleprecision float float4 float8 int integer number numeric real smallint tinyint | char character string text varchar | date datetime time timestamp timestamp_* | Boolean |
Microsoft SQL Server | bigint bit decimal int money numeric real smallint smallmoney tinyint | char nchar nvarchar text varchar | date datetime datetime2 datetimeoffset smalldatetime | bit |