Solid 上搜索怎么做?

在面对分布式数据源的时候,我们可能会在后端使用 GraphQL 之类的网关技术来缓存较慢的数据、拼凑多个数据为完整的数据、用一个数据源在另一个数据源里做筛选等等。

但是在 Web3.0(此处指 SoLiD 等语义网技术驱动的 the Data Web)中,我们需要在前端整合分布式数据源,这些数据源返回的数据在时间上是异步的,但返回的数据可能是同一类的。

替代文字
为什么会出现这样的情况?

这是因为数据与应用分离后,人们会为聊天记录购物历史等敏感数据的安全性买单,把它们存在高安的存储里面,然后把社交图片(本来就想要公开的那些)还有音乐视频收藏等等非原创内容放到不保证安全性的廉价数据存储里,还有一些数据会存放在应用开发商提供的免费存储里。

而企业、大学、IM 应用开发商都可能会提供小型的免费存储来供你存放聊天记录、工作文档,这时候如果你的前端应用里用一段 SPARQL 来取用户的聊天数据,你会发现 SPARQL 将会从用户的大学、公司、NAS 上获取到聊天数据的不同片段。

那么怎么进行这种跨 POD 的搜索呢?
如果你想搜索的不仅是自己的资源(在给定的几个 POD 内搜索),如果你想大面积地搜索互联网上的公开信息呢?
怎么利用好 RDF 来增强搜索交互?

(好的方案可能得到 5k - 5w 欧元的奖励 https://nlnet.nl/discovery/

本文借用了 https://www.zhihu.com/question/303073602/answer/546544064 中的一些说法。

挺有意思的课题,有时间的话研究下