数据集 - 海数据

立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis

2025年4月26日

立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis 数据来源：互联网公开数据标签：金融新闻，文本分析，自然语言处理，立陶宛，数据集，情感分析，信息抽取，语言模型数据概述：该数据集包含了来自立陶宛金融新闻的文本数据，旨在用于金融领域相关的文本分析任务。主要特征如下：时间跨度：...

ZIP

对话摘要训练结果数据集DialogueSummaryTrainingResultsDataset-liuzhuangzhuang

2025年4月26日

对话摘要训练结果数据集DialogueSummaryTrainingResultsDataset-liuzhuangzhuang 数据来源：互联网公开数据标签：自然语言处理，对话系统，数据集，文本摘要，机器学习，深度学习，语言模型，人工智能数据概述：...

ZIP

人类与人工智能交互文本数据集HelloClaude-1000EssaysfromAnthropic-jisukim8873

2025年4月26日

人类与人工智能交互文本数据集HelloClaude-1000EssaysfromAnthropic-jisukim8873 数据来源：互联网公开数据标签：自然语言处理，人工智能，文本数据，交互分析，机器学习，语言模型，深度学习，数据集数据概述：...

ZIP

自然语言处理基础数据集NLPDataset1-kryusufkaya

2025年4月26日

自然语言处理基础数据集NLPDataset1-kryusufkaya 数据来源：互联网公开数据标签：自然语言处理，数据集，文本分析，机器学习，语言模型，文本分类，情感分析，信息提取数据概述：该数据集包含来自互联网的公开文本数据，记录了多种自然语言处理任务的基础文本信息。主要特征如下：时间跨度：数据记录的时间范围未明确标注，涵盖多个时间段。...

ZIP

大型语言模型讽刺识别测试数据集LLMSarcasmTestDataset-datasontran

2025年4月26日

大型语言模型讽刺识别测试数据集LLMSarcasmTestDataset-datasontran 数据来源：互联网公开数据标签：自然语言处理，讽刺识别，数据集，机器学习，情感分析，文本分类，人工智能，语言模型数据概述：该数据集包含用于测试大型语言模型识别讽刺性文本的能力的数据，主要记录了带有标签的文本样本。主要特征如下：...

ZIP

孟加拉语新闻摘要数据集ProthomAlo-towhidahmedfoysal

2025年4月26日

孟加拉语新闻摘要数据集ProthomAlo-towhidahmedfoysal 数据来源：互联网公开数据标签：自然语言处理，文本摘要，孟加拉语，新闻，数据集，NLP，机器翻译，语言模型数据概述：该数据集包含来自孟加拉语新闻网站Prothom Alo的新闻文章及其摘要。主要特征如下：时间跨度：数据记录的时间范围未知，但涵盖了Prothom...

ZIP

JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555

2025年4月26日

JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555 数据来源：互联网公开数据标签：自然语言处理，机器翻译，数据集，文本分类，深度学习，数据验证，人工智能，语言模型数据概述：该数据集包含来自 Jigsaw 项目的数据，记录了用于验证和测试...

ZIP

大型语言模型与人工智能文本数据集LLM-AI-TextDataset-snehapriyaamp

2025年4月26日

大型语言模型与人工智能文本数据集LLM-AI-TextDataset-snehapriyaamp 数据来源：互联网公开数据标签：人工智能，语言模型，文本数据，自然语言处理，机器学习，深度学习，数据集，多语言处理数据概述：该数据集包含来自多个来源的文本数据，记录了大型语言模型（LLM）和人工智能（AI）生成的文本内容。主要特征如下：...

ZIP

生成文本与真实文本对比数据集GTP-GeneratedTextvs-RealTextDataset-manshanand

2025年4月26日

生成文本与真实文本对比数据集GTP-GeneratedTextvs-RealTextDataset-manshanand 数据来源：互联网公开数据标签：自然语言处理，文本生成，数据集，机器学习，文本对比，语言模型，人工智能，数据科学数据概述：...

ZIP

大型语言模型应用与机器学习挑战数据集LLMAO-MLChallengeDataset-rachitpatni

2025年4月26日

大型语言模型应用与机器学习挑战数据集LLMAO-MLChallengeDataset-rachitpatni 数据来源：互联网公开数据标签：人工智能，机器学习，数据集，自然语言处理，语言模型，深度学习，算法竞赛，应用研究数据概述：该数据集源自大型语言模型应用与机器学习挑战（LLMAO-ML...

ZIP

蜘蛛翻译数据集SpiderTranslationDataset-ahmedheakl2020

2025年4月26日

蜘蛛翻译数据集SpiderTranslationDataset-ahmedheakl2020 数据来源：互联网公开数据标签：自然语言处理，机器翻译，数据集，文本翻译，深度学习，语言模型，翻译研究，计算机科学数据概述：该数据集包含来自Spider项目的翻译数据，记录了多种语言之间的文本翻译对。主要特征如下：...

ZIP

对话数据集样本ConvoDatasetSample-rigveddesai

2025年4月26日

对话数据集样本ConvoDatasetSample-rigveddesai 数据来源：互联网公开数据标签：对话，文本，自然语言处理，数据集，语言模型，情感分析，文本生成，聊天机器人数据概述：该数据集包含对话文本样本，记录了不同场景下的对话内容。主要特征如下：时间跨度：数据记录的时间范围不固定，涵盖了不同时间段的对话。...

ZIP

提示词数据集PromptsDataset1-sandeepnambiar02

2025年4月26日

提示词数据集PromptsDataset1-sandeepnambiar02 数据来源：互联网公开数据标签：自然语言处理，数据集，提示工程，人工智能，机器学习，文本生成，语言模型，数据挖掘数据概述：该数据集专注于收集各类提示词（prompts），记录了不同场景下的文本提示信息。主要特征如下：时间跨度：数据记录的时间范围从2020年到2023年。...

ZIP

香港证监会注册数据集-姓名蕴含的人口统计信息丰富数据集-2003至今-gautiermarti

2025年4月22日

香港证监会注册数据集-姓名蕴含的人口统计信息丰富数据集-2003至今-gautiermarti 数据来源：互联网公开数据标签：香港证监会,注册数据,人口统计信息,性别,种族,年龄,姓名分析,大数据,语言模型数据概述：...

ZIP

文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees

2025年4月26日

文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees 数据来源：互联网公开数据标签：文本摘要，自然语言处理，数据集，机器翻译，深度学习，NLP，文本分析，语言模型数据概述：该数据集包含用于文本摘要任务的文本数据，旨在训练和评估自动文本摘要模型。主要特征如下：时间跨度：...

ZIP

全模型子集-文本摘要数据集FullModelSubsets-TextSummarizationDataset-herobartosz

2025年4月26日

全模型子集-文本摘要数据集FullModelSubsets-TextSummarizationDataset-herobartosz 数据来源：互联网公开数据标签：文本摘要，自然语言处理，数据集，机器学习，深度学习，语言模型，文本分析，摘要生成数据概述：...

ZIP

笑话内容分类数据集JokesDataset-yaroslav62

2025年4月26日

笑话内容分类数据集JokesDataset-yaroslav62 数据来源：互联网公开数据标签：自然语言处理，文本分类，数据集，幽默分析，机器学习，情感分析，娱乐内容，语言模型数据概述：该数据集包含来自互联网的笑话内容数据，记录了各类笑话的文本信息及其相关分类标签。主要特征如下：...

ZIP

语法修正数据集GrammarCorrectionDataDataset-uwelcomem

2025年4月26日

语法修正数据集GrammarCorrectionDataDataset-uwelcomem 数据来源：互联网公开数据标签：自然语言处理，语法修正，数据集，机器学习，语言模型，文本分析，人工智能，语言技术数据概述：该数据集包含来自互联网公开来源的语法修正数据，记录了原始文本及其对应的修正文本。主要特征如下：时间跨度：数据记录的时间范围为近年。...

ZIP

辛普森第一季剧本文本数据集SeinfeldSeason1TranscriptDataset-kingsleymoore

2025年4月26日

辛普森第一季剧本文本数据集SeinfeldSeason1TranscriptDataset-kingsleymoore 数据来源：互联网公开数据标签：剧本，文本分析，数据集，自然语言处理，机器学习，电视节目，对话分析，语言模型数据概述：该数据集包含来自美国情景喜剧《辛普森一家》第一季的剧本文本数据，记录了节目的对话和剧情内容。主要特征如下：...