fetch | 获取网页内容。
- 如果是 HTML, 则根据 returm 返回合适的内容,
- 如果不是 HTML,但是是 Text 或 Json 内容,则直接返回其内容。
- 如果是其它类型的内容,则返回错误信息。 Args:
url (str): 要获取的网页 URL。
return_content ("raw" | "basic_clean" | "strict_clean" | "markdown", optional): 默认为 "markdown",用于控制返回 html 内容的方式,
- 如果为 raw,返回原始 HTML 内容。
- 如果为 basic_clean,返回过滤后的 HTML 内容,过滤掉所有不会显示的标签,如 script, style 等。
- 如果为 strict_clean,返回过滤后的 HTML 内容,过滤掉所有不会显示的标签,如 script, style 等,并且会删除大部分无用的 HTML 属性。
- 如果为 markdown,HTML 转换为 Markdown 后返回。
Returns:
- 如果 return_content 为 raw,返回原始 HTML 内容。
- 如果 return_content 为 basic_clean,返回过滤后的 HTML 内容,过滤掉所有不会显示的标签,如 script, style 等。
- 如果 return_content 为 strict_clean,返回过滤后的 HTML 内容,过滤掉所有不会显示的标签,如 script, style 等,并且会删除大部分无用的 HTML 属性。
- 如果 return_content 为 markdown,HTML 转换为 Markdown 后返回。
|
fetch_to_file | 获取网页内容并保存到文件。
- 如果是 HTML, 则根据 return_content 返回合适的内容,
- 如果不是 HTML,但是是 Text 或 Json 内容,则直接保存其内容。
- 如果是其它类型的内容,则返回错误信息。 Args:
url (str): 要获取的网页 URL。
file_path (str): 要保存到的文件路径,必须是绝对路径。
return_content ("raw" | "basic_clean" | "strict_clean" | "markdown", optional): 默认为 "markdown",用于控制返回 html 内容的方式,
- 如果为 raw,返回原始 HTML 内容。
- 如果为 basic_clean,返回过滤后的 HTML 内容,过滤掉所有不会显示的标签,如 script, style 等。
- 如果为 strict_clean,返回过滤后的 HTML 内容,过滤掉所有不会显示的标签,如 script, style 等,并且会删除大部分无用的 HTML 属性。
- 如果为 markdown,HTML 转换为 Markdown 后返回。
Returns:
- 成功时返回文件保存路径
- 如果路径不安全则返回错误信息
|
http_get | 执行 HTTP GET 请求。 Args:
url (str): 请求的目标 URL。
query (Dict[str, str | int | float], optional): 可选参数,查询参数键值对。参数值会自动转换为字符串,并且会拼接到 url 里。
例如: {'key1': 'value1', 'key2': 2}会被转换为key1=value1&key2=2,并拼接到 url。
headers (Dict[str, str], optional): 可选参数,自定义的 http 请求头。
Returns:
str: 标准HTTP响应格式的字符串,包含状态行、响应头和响应体。
|
http_post | 执行 HTTP POST 请求。 Args:
url (str): 请求的目标 URL。
query (Dict[str, str | int | float], optional): 可选参数,查询参数键值对。参数值会自动转换为字符串,并且会拼接到 url 里。
例如: {'key1': 'value1', 'key2': 2}会被转换为key1=value1&key2=2,并拼接到 url。
headers (Dict[str, str], optional): 可选参数,自定义的 http 请求头。
data (str, optional): 可选参数,要发送的 http 请求体数据,必须是文本,data 和 json 参数不能同时使用。
json (Any, optional): 可选参数,要发送的 http 请求体数据,以 JSON 数据,会自动序列化为JSON字符串,data 和 json 参数不能同时使用。
Returns:
str: 标准HTTP响应格式的字符串,包含状态行、响应头和响应体。
|
http_put | 执行 HTTP PUT 请求。 Args:
url (str): 请求的目标 URL。
query (Dict[str, str | int | float], optional): 查询参数键值对。参数值会自动转换为字符串,并且会拼接到 url 里。
例如: {'key1': 'value1', 'key2': 2}会被转换为key1=value1&key2=2,并拼接到 url。
headers (Dict[str, str], optional): 可选参数,自定义的 http 请求头。
data (str, optional): 可选参数,要发送的 http 请求体数据,必须是文本,data 和 json 参数不能同时使用。
json (Any, optional): 可选参数,要发送的 http 请求体数据,以 JSON 数据,会自动序列化为JSON字符串,data 和 json 参数不能同时使用。
Returns:
str: 标准HTTP响应格式的字符串,包含状态行、响应头和响应体。
|
http_patch | 执行H TTP PATCH 请求。 Args:
url (str): 请求的目标 URL。
query (Dict[str, str | int | float], optional): 查询参数键值对。参数值会自动转换为字符串,并且会拼接到 url 里。
例如: {'key1': 'value1', 'key2': 2}会被转换为key1=value1&key2=2,并拼接到 url。
headers (Dict[str, str], optional): 可选参数,自定义的 http 请求头。
data (str, optional): 可选参数,要发送的 http 请求体数据,必须是文本,data 和 json 参数不能同时使用。
json (Any, optional): 可选参数,要发送的 http 请求体数据,以 JSON 数据,会自动序列化为JSON字符串,data 和 json 参数不能同时使用。
Returns:
str: 标准HTTP响应格式的字符串,包含状态行、响应头和响应体。
|
http_delete | 执行 HTTP DELETE 请求。 Args:
url (str): 请求的目标 URL。
query (Dict[str, str | int | float], optional): 查询参数键值对。参数值会自动转换为字符串,并且会拼接到 url 里。
例如: {'key1': 'value1', 'key2': 2}会被转换为key1=value1&key2=2,并拼接到 url。
headers (Dict[str, str], optional): 可选参数,自定义的 http 请求头。
data (str, optional): 可选参数,要发送的 http 请求体数据,必须是文本,data 和 json 参数不能同时使用。
json (Any, optional): 可选参数,要发送的 http 请求体数据,以 JSON 数据,会自动序列化为JSON字符串,data 和 json 参数不能同时使用。
Returns:
str: 标准HTTP响应格式的字符串,包含状态行、响应头和响应体。
|