您的位置: 首页 > 建站百科 >

为 jina 打造的命令行工具,提供获取网页内容、生成向量数据等等

100次浏览     发布时间:2025-04-03 08:43:47    

简介

Jina.ai 是一家专注于大型语言模型和媒体处理公司。基于 jina.ai 公司的接口,jina 模块主要提供了以下功能:

  • 网页内容获取
  • 生成文本向量
  • 相关信息检索排序检索

主要特点

  • 通过 jina模块的 Reader 功能,我们赋予了 AI 大模型便捷和实时获取网站内容的能力。 无论是本地的 llmf, ollama 亦或是 Chatgpt ,Kimi 和 Gemini 都可以实时获取网站内容并处理。


子命令

名称

描述

x jina embed

用向量来表示文本的含义

x jina reader

获取网页信息

x jina search

从网络中搜索查询,并返回前五条数据

x jina reranker

信息检索

x jina --cfg

配置管理,可管理 apikey、请求默认代理等配置

x jina init

使用交互模式初始化配置

例子

获取 x-cmd 网站的内容,以 Markdown 格式返回; 这是 'x jina reader x-cmd.com' 的简写形式

x jina x-cmd.com

获取 x-cmd 网站的内容,以 HTML 格式返回; 这是 'x jina reader --html x-cmd.com' 的简写形式

x jina --html x-cmd.com

获取 x-cmd 网站的内容,不要使用本地和服务器上的缓存; 这是 'x jina reader --nocache x-cmd.com' 的简写形式

x jina --nocache x-cmd.com

获取 x-cmd 网站的的快照

x jina --screenshot x-cmd.com

生成 "how are you" 字符串的向量数据

x jina embed generate how are you

生成 license 文件的字符串的向量数据

x jina embed generate --file ./license

通过流式生成 "how are you" 字符串的向量数据

echo how are you | x jina embedding generate -

使用 "\n" 分隔符切割 LICENSE 文件中并查找 how are you 向量相似度最高的前三条句子

x jina reranker generate  --yml -f ./LICENSE  --sep "\n" --top 3 how are you

在文件 a 和文件 b 中查找哪个文件的内容与 how are you 的相似度最高

x jina reranker generate  --yml -f ./a -f ./b how are you

列出所有的信息检索模型模型

x jina reranker model ls

列出所有的向量模型模型

x jina embed model ls

相关文章