aws

AWS Quicksight chấp nhận dữ liệu từ nhiều nguồn khác nhau. Khi bạn nhấp vào “Tập dữ liệu mới” trên trang chủ, nó cung cấp cho bạn các tùy chọn về tất cả các nguồn dữ liệu có thể được sử dụng. Dưới đây là các nguồn chứa danh sách tất cả các nguồn bên trong và bên ngoài

kết nối Quicksight với một số nguồn dữ liệu được sử dụng phổ biến nhất –

Tải lên tệp từ hệ thống

Nó chỉ cho phép bạn nhập các tệp định dạng .csv, .tsv, .clf, .elf.xlsx và Json. Sau khi bạn chọn tệp, Quicksight sẽ tự động nhận dạng tệp và hiển thị dữ liệu. Khi bạn nhấp vào nút Tải lên tệp , bạn cần cung cấp vị trí của tệp mà bạn muốn sử dụng để tạo tập dữ liệu.

Sử dụng tệp từ định dạng S3

Màn hình sẽ xuất hiện như bên dưới. Trong Tên nguồn dữ liệu, bạn có thể nhập tên được hiển thị cho tập dữ liệu sẽ được tạo. Ngoài ra, bạn sẽ yêu cầu tải lên tệp kê khai từ hệ thống cục bộ của mình hoặc cung cấp vị trí S3 của tệp kê khai.

Tệp kê khai là tệp định dạng json, chỉ định url / vị trí của tệp đầu vào và định dạng của chúng. Bạn có thể nhập nhiều tệp đầu vào, miễn là định dạng giống nhau. Đây là một ví dụ về tệp kê khai. Tham số “URI” được sử dụng để chuyển vị trí của tệp đầu vào là S3.

{
   "fileLocations": [
      {
         "URIs": [
            "url of first file",
            "url of second file",
            "url of 3rd file and so on"
         ]
      },
   
   ],
}
"globalUploadSettings": {
   "format": "CSV",
   "delimiter": ",",
   "textqualifier": "'",
   "containsHeader": "true"
}

Các tham số được truyền trong globalUploadSettings là những tham số mặc định. Bạn có thể thay đổi các thông số này theo yêu cầu của bạn.

MySQL

Bạn cần nhập thông tin cơ sở dữ liệu vào các trường để kết nối với cơ sở dữ liệu của mình. Sau khi nó được kết nối với cơ sở dữ liệu của bạn, bạn có thể nhập dữ liệu từ nó

Thông tin sau là bắt buộc khi bạn kết nối với bất kỳ cơ sở dữ liệu RDBMS nào –

  • Tên DSN
  • Loại kết nối
  • Tên máy chủ cơ sở dữ liệu
  • Tên cơ sở dữ liệu
  • Tên tài khoản
  • Mật khẩu

Các nguồn dữ liệu dựa trên RDBMS sau được hỗ trợ trong Quicksight –

  • Amazon Athena
  • Amazon-Aurora
  • Amazon Redshift
  • Amazon S3
  • Phân tích Amazon S3
  • Apache Spark 2.0 trở lên
  • MariaDB 10.0 trở lên
  • Microsoft SQL Server 2012 trở lên
  • MySQL 5.1 trở lên
  • PostgreSQL 9.3.1 trở lên
  • Presto 0.167 trở lên
  • Teradata 14.0 trở lên

Athena

Athena là công cụ AWS để chạy các truy vấn trên bảng. Bạn có thể chọn bất kỳ bảng nào từ Athena hoặc chạy một truy vấn tùy chỉnh trên các bảng đó và sử dụng kết quả của các truy vấn đó trong Quicksight. Có một số bước để chọn nguồn dữ liệu Khi bạn chọn Athena, màn hình bên dưới sẽ xuất hiện. Bạn có thể nhập bất kỳ tên nguồn dữ liệu nào mà bạn muốn cấp cho nguồn dữ liệu của mình trong Quicksight. Nhấp vào “Xác thực kết nối” . Sau khi kết nối được xác thực, hãy nhấp vào nút “ Tạo nguồn mới”

Bây giờ chọn tên bảng từ menu thả xuống. Menu thả xuống sẽ hiển thị các cơ sở dữ liệu hiện có trong Athena, sẽ hiển thị thêm các bảng trong cơ sở dữ liệu đó. Nếu không, bạn có thể nhấp vào “Sử dụng SQL tùy chỉnh” để chạy truy vấn trên bảng Athena.

Sau khi hoàn tất, bạn có thể nhấp vào “Chỉnh sửa / Xem trước dữ liệu” hoặc “Hình ảnh hóa” để chỉnh sửa dữ liệu của bạn hoặc trực quan hóa dữ liệu theo yêu cầu của bạn.

Xóa nguồn dữ liệu

Khi bạn xóa nguồn dữ liệu đang được sử dụng trong bất kỳ trang tổng quan Quicksight nào, điều đó có thể làm cho tập dữ liệu được liên kết không sử dụng được. Nó thường xảy ra khi bạn truy vấn nguồn dữ liệu dựa trên SQL.

Khi bạn tạo tập dữ liệu dựa trên S3, Lực lượng bán hàng hoặc SPICE , điều đó không ảnh hưởng đến khả năng sử dụng bất kỳ tập dữ liệu nào của bạn vì dữ liệu được lưu trữ trong SPICE; tuy nhiên tùy chọn làm mới không khả dụng trong trường hợp này. Để xóa nguồn dữ liệu, hãy chọn nguồn dữ liệu. Điều hướng đến tab Từ nguồn dữ liệu hiện có khi tạo trang tập dữ liệu.

Trước khi xóa, bạn cũng có thể xác nhận kích thước bảng ước tính và các chi tiết khác của nguồn dữ liệu.

Khi bạn sử dụng các nguồn dữ liệu khác nhau trong công cụ Quicksight, sẽ có những giới hạn nhất định áp dụng dựa trên nguồn dữ liệu.

Tập tin

Bạn có thể sử dụng tối đa 25GB tổng kích thước được chỉ định trong tệp kê khai. Giới hạn này phụ thuộc vào kích thước tệp sau khi nó được nhập vào SPICE.

Số lượng tệp được hỗ trợ trong tệp kê khai là 1000 và bạn cũng có một số giới hạn về số cột trong mỗi tệp.

Bảng và Truy vấn

Khi bạn đang truy vấn một bảng lớn, bạn nên sử dụng Điều kiện ở đâu hoặc Có để giảm số lượng dữ liệu được nhập vào SPICE. Kết quả truy vấn được nhập vào SPICE không được vượt quá 25 GB.

Bạn có thể bỏ chọn một số cột trong khi nhập dữ liệu vào SPICE.

Trong trường hợp nguồn dữ liệu của bạn chứa loại dữ liệu không được hỗ trợ trong Quicksight, AWS Quicksight sẽ bỏ qua các giá trị đó.

Person IDSales DateAmount
00110/14/201712.43
0025/3/201725.00
003Unknown18.17
0043/8/201986.02

From the above values, Quicksight will drop the no date value row while importing this data in dataset. Following data types are supported in Quicksight −

Database SourceNumber Data TypesString Data TypesDate time Data TypesBoolean Data Types
Amazon Athena,Prestobigint decimal double integer real smallint tinyintchar varchardate timestampBoolean
Amazon Aurora, MariaDB,and MySQLbigint decimal double int integer mediumint numeric smallint tinyintchar enum set text varchardate datetime timestamp year
PostgreSQLbigint decimal double integer numeric precision real smallintchar character text varchar varying characterdate timestampBoolean
Apache Sparkbigint decimal double integer real smallint tinyintvarchardate timestampBoolean
Snowflakebigint byteint decimal double doubleprecision float float4 float8 int integer number numeric real smallint tinyintchar character string text varchardate datetime time timestamp timestamp_*Boolean
Microsoft SQL Serverbigint bit decimal int money numeric real smallint smallmoney tinyintchar nchar nvarchar text varchardate datetime datetime2 datetimeoffset smalldatetimebit

AWS Quicksight – Chỉnh sửa tập dữ liệu (xem thêm)

Để lại một bình luận