-
文本生成与欺骗检测论文写作数据集TextGenerationandDeceptionDetectionEssayDataset-laurensprast
文本生成与欺骗检测论文写作数据集TextGenerationandDeceptionDetectionEssayDataset-laurensprast 数据来源:互联网公开数据 标签:文本生成, 欺骗检测, 论文写作, 语言模型, 自然语言处理, 文本分类, 机器学习, 数据标注 数据概述:... -
Chipotle谷歌地图评论数据集ChipotleGoogleMapsReviewsDataset-abhijeet0706
Chipotle谷歌地图评论数据集ChipotleGoogleMapsReviewsDataset-abhijeet0706 数据来源:互联网公开数据 标签:餐饮业,谷歌地图,评论分析,数据集,自然语言处理,用户反馈,市场研究,消费者行为... -
文本情感分析与分类数据集TextSentimentAnalysisandClassificationDataset-tylorkim
文本情感分析与分类数据集TextSentimentAnalysisandClassificationDataset-tylorkim 数据来源:互联网公开数据 标签:文本情感分析, 情感分类, 自然语言处理, 机器学习, 文本数据, 情感倾向, 数据标注, 情绪识别 数据概述:... -
泰英双语翻译文本数据集Thai-EnglishBilingualTranslationText-jaroensakyodkantha
泰英双语翻译文本数据集Thai-EnglishBilingualTranslationText-jaroensakyodkantha 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 双语语料库, 泰语, 英语, 自然语言处理, 语言学, 数据清洗 数据概述:... -
组合嵌入向量数据集-ishaaaaan
组合嵌入向量数据集-ishaaaaan 数据来源:互联网公开数据 标签:嵌入向量,自然语言处理,文本分析,机器学习,语义理解,深度学习,词向量,文本表示 数据概述:该数据集包含组合嵌入向量,用于文本表示和语义分析。主要特征如下: 时间跨度:数据更新频率不定,取决于原始数据的更新。... -
自然语言推理数据集NaturalLanguageInferenceDataset-karthikeyanmsk
自然语言推理数据集NaturalLanguageInferenceDataset-karthikeyanmsk 数据来源:互联网公开数据 标签:自然语言处理, 文本推理, 语义理解, 句子关系, 多分类, 假设验证, 预训练模型, 数据集 数据概述:... -
多语言恶意评论检测数据集MultilingualToxicCommentsDetection-anthonynama
多语言恶意评论检测数据集MultilingualToxicCommentsDetection-anthonynama 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 多语言, 恶意评论, 毒性检测, 情感分析, 预训练模型, BERT 数据概述:... -
文件检索增强生成数据集RAGFilesDataset-anrenk
文件检索增强生成数据集RAGFilesDataset-anrenk 数据来源:互联网公开数据 标签:数据集,信息检索,自然语言处理,生成式AI,文件处理,知识管理,AI应用,文本分析 数据概述:该数据集包含用于检索增强生成(RAG)任务的多格式文件数据,记录了各类文档、文本和文件的检索与生成数据。主要特征如下:... -
文档图像识别与光学字符识别数据集DCICOCRDocumentImageRecognitionDataset-panfei748
文档图像识别与光学字符识别数据集DCICOCRDocumentImageRecognitionDataset-panfei748 数据来源:互联网公开数据 标签:文档识别,光学字符识别,数据集,图像处理,机器学习,自然语言处理,计算机视觉,人工智能 数据概述: 该数据集由文档图像识别与光学字符识别竞赛(DCIC... -
法律领域推文数据集Tweets-LawDataset-milanezeus
法律领域推文数据集Tweets-LawDataset-milanezeus 数据来源:互联网公开数据 标签:推文数据,法律,社交媒体,文本分析,自然语言处理,情感分析,舆情监测,法律研究 数据概述: 该数据集包含来自Twitter平台的推文数据,主要与法律领域相关。主要特征如下:... -
文本错别字检测与纠正数据集Typo-IntroDataset-chasembowers
文本错别字检测与纠正数据集Typo-IntroDataset-chasembowers 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,错别字检测,机器学习,语言模型,文本纠错,人工智能 数据概述: 该数据集专注于文本中的错别字检测与纠正,记录了大量包含错别字的文本样本及其对应的正确文本。主要特征如下:... -
虚假公司评论数据集FakeCompanyReviewsDataset-sachinsk
虚假公司评论数据集FakeCompanyReviewsDataset-sachinsk 数据来源:互联网公开数据 标签:评论分析,数据集,文本挖掘,自然语言处理,情感分析,机器学习,商业分析,数据科学 数据概述: 该数据集包含来自互联网的虚假公司评论数据,记录了用户对公司产品的虚假评价信息。主要特征如下:... -
Reddit政治子版块互动数据集RedditPoliticalSubredditsInteractionDataset-collinsw
Reddit政治子版块互动数据集RedditPoliticalSubredditsInteractionDataset-collinsw 数据来源:互联网公开数据 标签:社交媒体,政治,Reddit,文本分析,自然语言处理,网络分析,舆情分析,社区互动 数据概述:... -
文本情感分析与主题识别数据集TagModelFinal-TextSentimentAnalysisandTopicIdentificationDatase...
文本情感分析与主题识别数据集TagModelFinal-TextSentimentAnalysisandTopicIdentificationDataset-hongkhngdu 数据来源:互联网公开数据 标签:文本分析,情感分析,主题识别,自然语言处理,机器学习,数据集,情感分类,主题建模... -
新闻摘要生成数据集XLSumCSVDataset-phoenixdev
新闻摘要生成数据集XLSumCSVDataset-phoenixdev 数据来源:互联网公开数据 标签:新闻摘要,数据集,自然语言处理,文本生成,机器学习,信息提取,人工智能,语言模型 数据概述: 该数据集包含来自多个新闻来源的新闻摘要数据,记录了新闻文章及其对应的摘要信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2021年。... -
学术文本命名实体识别预测数据集AcademicTextNamedEntityRecognitionPredictionDataset-vanle73
学术文本命名实体识别预测数据集AcademicTextNamedEntityRecognitionPredictionDataset-vanle73 数据来源:互联网公开数据 标签:命名实体识别, 文本标注, 机器学习, 自然语言处理, 文本分类, 预测结果, 评估分析, 学术研究 数据概述:... -
孟加拉国新闻评论数据集ProthomaloCommentsDataset-twintyone
孟加拉国新闻评论数据集ProthomaloCommentsDataset-twintyone 数据来源:互联网公开数据 标签:新闻评论,社交媒体,数据集,自然语言处理,情感分析,文本挖掘,新闻学,社会科学 数据概述:该数据集包含来自孟加拉国知名新闻网站Protomalo的新闻评论,记录了读者对各种新闻文章的评论内容。主要特征如下:... -
韩国新闻文本分类数据集KoreanNewsTextClassification-jungeuncha
韩国新闻文本分类数据集KoreanNewsTextClassification-jungeuncha 数据来源:互联网公开数据 标签:文本分类, 新闻数据, 韩国, 情感分析, 自然语言处理, 机器学习, 多类别分类, 数据标注 数据概述: 该数据集包含来自韩国新闻报道的文本数据,记录了新闻标题、内容及其对应的类别标签。主要特征如下:... -
印地语和泰米尔语维基文本数据集HindiandTamilWikiTextDataset-starkking07
印地语和泰米尔语维基文本数据集HindiandTamilWikiTextDataset-starkking07 数据来源:互联网公开数据 标签:自然语言处理,语言模型,文本分类,印地语,泰米尔语,数据集,机器学习,多语言处理 数据概述: 该数据集包含来自维基百科的印地语和泰米尔语文本数据,记录了两门语言的维基百科文章内容。主要特征如下:... -
电影剧本类型分析数据集MovieScriptsGenreDataset-laurenszlosek
电影剧本类型分析数据集MovieScriptsGenreDataset-laurenszlosek 数据来源:互联网公开数据 标签:电影,剧本,类型,文本分析,自然语言处理,数据集,情感分析,机器学习 数据概述: 该数据集包含了电影剧本的内容,并按电影类型进行了分类,旨在为电影剧本分析提供数据支持。主要特征如下:...