Linked Data: Vai trò của Máy chủ Dữ liệu (Nguyên văn: Linked Data: The role of the Data Server)


Summary

Bài viết này khám phá vai trò của máy chủ dữ liệu trong việc ứng dụng Linked Data, một xu hướng đang ngày càng trở nên quan trọng trong lĩnh vực CNTT. Key Points:

  • Máy chủ dữ liệu đóng vai trò quan trọng trong việc quản lý và cung cấp liên kết giữa các dữ liệu khác nhau, tạo điều kiện cho sự trao đổi thông tin hiệu quả.
  • Việc áp dụng Linked Data giúp tối ưu hóa quá trình phân tích và truy xuất thông tin, từ đó nâng cao chất lượng nghiên cứu và phát triển công nghệ.
  • Sự kết hợp giữa Linked Data và AI mở ra cơ hội mới trong việc hiểu sâu sắc hơn về mối quan hệ giữa các tập dữ liệu, giúp cải thiện khả năng ra quyết định.
Cuộc cách mạng trong quản lý dữ liệu đang diễn ra với sự hỗ trợ đắc lực từ máy chủ dữ liệu và công nghệ liên kết.

Nguyên văn

So I have talked about how RDF is really simple, and why Linked Data are the roots of the web… but we need a way of serving this data in a meaningful way, this is where the Data Server steps in!

The allegory continues……

A data server diggs out linked data from the soil

Here we see our home-grower digging up some potatoes.

The potatoes are Linked Data Objects (with relations interconnecting them), the home-grower is our data server and the act of digging is the process of fetching information (via a method such as REST). The soil is the machine-friendly Data Web.

Because the potatoes cannot be eaten straight from the ground:

A data server needs to prepare and cook data to give it context

The home-grower will need to prepare the potatoes by peeling, chopping and then cooking them. They may be cooked by boiling, baking or using some other method.

The home-grower is still a data server, and the act of preparing and cooking is to be able to get the data in a certain context with other information that the user demands, different users will want to see things in different ways hence the different cooking methods. Context is essential.

The potatoes are then ready to serve:

A data server will serve the data in a human friendly way

Because different people will like to eat their potatoes in different ways and with different things the home-grower will know exactly how their guests would like their potatoes! Some people like quorn fillets with peas and mashed potato and some prefer a lump of meat with some roast potatoes.

Different people are essentially different users, and they will want to see the data in a human friendly fashion. So styling and interaction is a part of serving this information. Note that presentation is related to the type of data that you want to show, but it should not be the same thing, a good use of data-code-presentation separation is advised when developing systems.

OpenLink Virtuoso: The Linked Data Server

Virtuoso is a “Universal Server”, which means that it is capable of doing all that is described above. To break things down a bit:

Being able to fetch information from data stores via webservices (and via scraping/sponging)
Being able to manipulate Linked Data graphs.
Storing its own graphs inside the native database (or other database management systems via virtualisation techniques).
Using query languages (e.g. SPARQL) to find specific data.
Using methods of graph manipulation to provide data in a certain context.
Providing meaningful data to the user using the typical XHTML+JavaScript+CSS setup.
Virtuoso Platform Conceptual View

Image is a conceptual view of the Virtuoso architecture and is available, with more information, from the Virtuoso homepage

More information

More information is available from the following Document Web sites:

The Virtuoso Homepage, the OpenLink Whitepapers and the Virtuoso Documentation system
Wikipedia sites for the subjects of Object’s in computer science (DBpedia: Object (computer science) ) and Web 3.0 (DBpedia: Web 3.0)
Data Servers are essentially extended triplestores; you may be interested in seeing the Wikipedia article for triplestores (DBpedia: triplestore). (As OpenLink Virtuoso is omnifunctional in nature, the triplestore is just one part of this powerful architecture)
p.s. sorry about the crude drawings, but they do show the point. Once again if you would like to use them somewhere then do give me a nudge, I am very unlikely to say no but I would like you to tell me about it first. Thank you :-)

p.s. do email me, skype me or comment if you would like me to clear anything up, or if you would like to discuss how Virtuoso might work for you. My details are available on my personal site and via my personal URI.

Quan điểm mới

Data Server – Cách đưa Linked Data đến gần người dùng hơn
Tôi đã từng nói về RDF và lý do tại sao Linked Data là nền tảng cốt lõi của Web. Nhưng để dữ liệu này thực sự hữu ích và dễ tiếp cận, chúng ta cần một cách để cung cấp nó theo cách có ý nghĩa. Và đây chính là vai trò của Data Server.

1. Data Server – Công cụ “đào xới” dữ liệu liên kết
Hãy tưởng tượng một người nông dân đang đào khoai tây từ lòng đất:

Khoai tây chính là các Linked Data Objects (các thực thể dữ liệu có quan hệ liên kết với nhau).
Người nông dân chính là Data Server.
Hành động đào là quá trình truy xuất dữ liệu từ Web ngữ nghĩa (thông qua REST API hoặc các phương pháp khác).
Đất tượng trưng cho Data Web, nơi chứa dữ liệu định dạng máy có thể đọc được.
Nhưng khoai tây không thể ăn ngay sau khi đào, nó cần được xử lý.

2. Xử lý dữ liệu – Đưa dữ liệu vào bối cảnh phù hợp
Sau khi đào được khoai tây, người nông dân cần chuẩn bị và chế biến nó:

Gọt vỏ
Cắt nhỏ
Nấu bằng các phương pháp khác nhau: luộc, nướng, chiên, hấp...
Trong thế giới dữ liệu, quá trình này tương ứng với:

Chuẩn bị dữ liệu theo bối cảnh phù hợp.
Tạo ra các liên kết có ý nghĩa với những dữ liệu khác.
Tùy chỉnh cách trình bày dữ liệu dựa trên yêu cầu của người dùng.
Mỗi người dùng có nhu cầu khác nhau, vì vậy Data Server phải linh hoạt trong việc cung cấp dữ liệu theo nhiều cách khác nhau.

3. Cung cấp dữ liệu theo cách thân thiện với con người
Một đầu bếp giỏi sẽ biết khách của mình thích ăn khoai tây theo cách nào.

Một số người thích khoai nghiền kèm đậu Hà Lan và chả chay.
Một số người thích khoai nướng kèm thịt bò.
Tương tự, người dùng khác nhau sẽ muốn xem dữ liệu theo nhiều cách khác nhau.

Một nhà phát triển có thể muốn dữ liệu dưới dạng JSON hoặc RDF.
Một nhà phân tích dữ liệu có thể muốn nó dưới dạng bảng hoặc biểu đồ.
Một người dùng thông thường có thể muốn một giao diện đơn giản, dễ hiểu.
Vì vậy, trình bày và tương tác dữ liệu là một phần quan trọng trong việc phục vụ thông tin. Nhưng việc hiển thị dữ liệu không nên trộn lẫn với cách dữ liệu được tổ chức – ta nên tách biệt dữ liệu, mã nguồn và giao diện hiển thị để dễ quản lý.

4. OpenLink Virtuoso – Data Server mạnh mẽ cho Linked Data
Virtuoso là một hệ thống Universal Server, có thể làm tất cả những điều trên. Cụ thể:

Truy xuất dữ liệu từ nhiều nguồn (cơ sở dữ liệu, API, hoặc crawling/scraping).
Quản lý đồ thị Linked Data.
Lưu trữ đồ thị dữ liệu trong cơ sở dữ liệu riêng hoặc tích hợp với hệ thống khác.
Truy vấn dữ liệu bằng SPARQL.
Tạo bối cảnh dữ liệu bằng cách liên kết dữ liệu có liên quan.
Cung cấp dữ liệu theo cách thân thiện với con người, thông qua XHTML + JavaScript + CSS.
Đây là lý do tại sao Virtuoso được xem là một nền tảng quan trọng trong thế giới Linked Data Web.

Tìm hiểu thêm
Nếu bạn quan tâm đến cách Data Server và Linked Data Web hoạt động, bạn có thể tham khảo:

Virtuoso Homepage – Giới thiệu đầy đủ về Virtuoso
Wikipedia về Triplestore và Web 3.0
Linked Data Deployment Technical Whitepaper (PDF)
DBpedia về Triplestore – Tìm hiểu về cách lưu trữ dữ liệu dạng ba ngôi
Các ontology phổ biến:
FOAF (Friend of a Friend) – Mạng xã hội ngữ nghĩa
SIOC – Mô hình hóa dữ liệu blog, diễn đàn
SKOS – Hệ thống tổ chức tri thức
SCOT, MOAT – Các hệ thống gắn thẻ ngữ nghĩa
Kết luận
Linked Data Web không chỉ là về RDF và dữ liệu liên kết. Để dữ liệu thực sự hữu ích, chúng ta cần một hệ thống Data Server mạnh mẽ để truy xuất, xử lý và trình bày dữ liệu một cách có ý nghĩa.

Virtuoso chính là một nền tảng làm được điều đó, giúp kết nối dữ liệu theo cách mà cả con người và máy móc đều có thể hiểu được.
Extended Perspectives Comparison:

Reference Articles

Linked Data cho các ứng dụng web ngữ nghĩa

liên kết đến một số hồ sơ hay tài nguyên của người khác đã biết và sẵn có trên Web. Sau khi xuất bản lên Web, duyệt dữ liệu với trình duyệt hỗ trợ Linked Data.

DỮ LIỆU LỚN VÀ DỮ LIỆU LIÊN KẾT MỞ | PDF

Bài báo trình bày tổng quan về dữ liệu lớn (Big Data) và dữ liệu liên kết mở (Linked Open Data), các đặc điểm và cách tiếp cận nghiên cứu chúng.

Source: Scribd

Cấu trúc dữ liệu: định nghĩa, 8 loại kiểu data structure cần ...

Tích hợp linh hoạt và hiệu quả : Cấu trúc này cho phép tích hợp các giải pháp mới một cách linh hoạt với các hệ thống truyền thống và tạo ra một ...

Source: Mstar Corp

Quy tắc Linked Data - Tổng quan về Web ngữ nghĩa

Quy tắc Linked Data · 1. Dùng URI để định danh mọi tài nguyên. · 2. Sử dụng HTTP URI để các tài nguyên này được tham chiếu và tìm kiếm ("tham chiếu lại") bởi mọi ...

Source: 123doc

Máy chủ (Server) là gì? Có mấy loại? Có vai trò như thế nào?

Một VPS có thể chứa được hàng trăm hosting khác, đặc biệt tối ưu cho việc xây dựng hệ thống Mail Server, Web Server hoặc Backup/Storage Server.

Universal Data Link (UDL) Configuration - OLE DB Driver ...

Learn how to use the Connection tab to specify how to connect to your data using the OLE DB Driver for SQL Server.

Source: Microsoft Learn

Sử dụng Database link trong Oracle

Trong Oracle, Database link là 1 công cụ giúp chúng ta lấy dữ liệu giữa các database Oracle với nhau một cách thuận tiện.


vanirsystems

Expert

Related Discussions

❖ Related Articles

Tags