-
产品清洗训练数据集CleanedProductsTrainingDataDataset-koteswaruduakula
产品清洗训练数据集CleanedProductsTrainingDataDataset-koteswaruduakula 数据来源:互联网公开数据 标签:产品数据,数据清洗,机器学习,文本分析,自然语言处理,数据集,数据预处理,信息提取 数据概述: 该数据集包含经过清洗和标准化的产品数据,主要用于训练和评估产品数据清洗模型。主要特征如下:... -
信息检索研究数据集-khamalking
信息检索研究数据集-khamalking 数据来源:互联网公开数据 标签:信息检索,数据集,文本分析,自然语言处理,机器学习,搜索,语义理解,文本挖掘 数据概述: 该数据集包含用于信息检索领域的研究和评估的文本数据。主要特征如下: 时间跨度:数据记录的时间跨度不定,取决于具体的数据来源,但通常涵盖了近年来公开的文本和文档。... -
DistilBERT预处理数据集DistilBERTPreprocessedDataset-kirillklyukvin
DistilBERT预处理数据集DistilBERTPreprocessedDataset-kirillklyukvin 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,数据集,文本分类,机器学习,深度学习,文本分析,人工智能 数据概述:... -
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan 数据来源:互联网公开数据 标签:歌词,翻译,数据集,自然语言处理,机器翻译,文本分析,多语言,语言学 数据概述: 该数据集包含来自多个来源的歌曲歌词及其对应的翻译文本,旨在用于机器翻译、文本分析和多语言研究。主要特征如下:... -
COVID-19相关医学文献分析数据集COVID-19RelatedMedicalLiteratureAnalysis-saumya94
COVID-19相关医学文献分析数据集COVID-19RelatedMedicalLiteratureAnalysis-saumya94 数据来源:互联网公开数据 标签:COVID-19, 医学文献, 文本分析, 传染病, 呼吸系统疾病, 自然语言处理, 疫情研究, 生物医学 数据概述: 该数据集包含来自PMC(Pubmed... -
印地语语料库数据集HindiCorpusDataset-flaming0
印地语语料库数据集HindiCorpusDataset-flaming0 数据来源:互联网公开数据 标签:印地语,语料库,自然语言处理,文本分析,语言学,机器学习,数据集,印度 数据概述: 该数据集包含来自互联网和公开资源的印地语文本数据,记录了印地语的丰富文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
NCAA篮球赛推特数据集NCAATweetsDataset-mika30
NCAA篮球赛推特数据集NCAATweetsDataset-mika30 数据来源:互联网公开数据 标签:NCAA,篮球,社交媒体,推特,数据集,文本分析,体育分析,社会学研究 数据概述:该数据集包含来自推特的关于NCAA篮球赛的处理后的推文数据,记录了球迷的实时互动和讨论内容。主要特征如下: 时间跨度:数据记录的时间范围从2017年到2021年。... -
自然语言处理与教育领域多层次问题嵌入数据集2-LevelQuestionEmbeddingsDatasetforNLPandEducation-hariwu1995
自然语言处理与教育领域多层次问题嵌入数据集2-LevelQuestionEmbeddingsDatasetforNLPandEducation-hariwu1995 数据来源:互联网公开数据 标签:自然语言处理,教育技术,数据集,问题嵌入,文本分析,机器学习,语义理解,知识图谱 数据概述:... -
歌词清洗与预处理数据集-kalyanitewari
歌词清洗与预处理数据集-kalyanitewari 数据来源:互联网公开数据 标签:歌词,文本分析,自然语言处理,数据集,情感分析,音乐,数据清洗,中文 数据概述: 该数据集包含了经过清洗和预处理的歌词数据,旨在为自然语言处理和文本分析任务提供高质量的文本资源。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了不同年代的歌词。... -
多源文本与图像综合分析数据集Multi-sourceTextandImageIntegratedAnalysisDataset-qiexifan
多源文本与图像综合分析数据集Multi-sourceTextandImageIntegratedAnalysisDataset-qiexifan 数据来源:互联网公开数据 标签:文本分析, 图像识别, 情感分析, 新闻数据, 社交媒体, 图像分类, 数据融合, 机器学习 数据概述:... -
东南亚足球赛事新闻摘要数据集SoutheastAsiaFootballNewsSummarization-tungchu
东南亚足球赛事新闻摘要数据集SoutheastAsiaFootballNewsSummarization-tungchu 数据来源:互联网公开数据 标签:足球, 新闻摘要, 自然语言处理, 文本分析, 赛事报道, 东南亚, 越南, 机器学习 数据概述:... -
民宿租赁市场用户评价与房源信息数据集AirbnbUserReviewsandListingInformation-leandroborba
民宿租赁市场用户评价与房源信息数据集AirbnbUserReviewsandListingInformation-leandroborba 数据来源:互联网公开数据 标签:民宿, Airbnb, 用户评价, 房源信息, 租赁市场, 文本分析, 市场调研, 价格预测 数据概述:... -
社交媒体平台ChatGPT相关话题讨论数据集SocialMediaChatGPTTopicDiscussionDataset-monserratromero
社交媒体平台ChatGPT相关话题讨论数据集SocialMediaChatGPTTopicDiscussionDataset-monserratromero 数据来源:互联网公开数据 标签:ChatGPT, 社交媒体, 文本分析, 自然语言处理, 情感分析, 话题挖掘, 人工智能, 机器学习 数据概述:... -
文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal
文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校对,机器学习,语言模型,文本分析,中文 数据概述: 该数据集包含用于拼写纠错任务的文本数据,专注于中文文本的拼写错误及其对应的正确文本。主要特征如下:... -
联系人识别预测数据集ContactIdentificationPredictionDataset-aruaru0
联系人识别预测数据集ContactIdentificationPredictionDataset-aruaru0 数据来源:互联网公开数据 标签:联系人识别, 预测模型, 机器学习, 文本分析, 交叉验证, 目标检测, 数据融合, 深度学习 数据概述: 该数据集包含用于联系人识别预测任务的数据,主要用于构建和评估预测模型。主要特征如下:... -
电子邮件钓鱼检测数据集-dhruvagarwal433
电子邮件钓鱼检测数据集-dhruvagarwal433 数据来源:互联网公开数据 标签:电子邮件,钓鱼检测,网络安全,机器学习,自然语言处理,文本分析,恶意软件,欺诈 数据概述: 该数据集包含了用于电子邮件钓鱼检测的数据,旨在帮助研究人员和安全专家开发和评估钓鱼邮件的识别技术。主要特征如下:... -
布拉斯-数字图书馆数据集Bolsa-DLDataset-luisandresgarcia
布拉斯-数字图书馆数据集Bolsa-DLDataset-luisandresgarcia 数据来源:互联网公开数据 标签:数字图书馆,数据集,文本分析,信息检索,机器学习,学术资源,自然语言处理,知识管理 数据概述: 该数据集包含来自布拉斯-数字图书馆(Bolsa-DL)的文本数据,记录了该数字图书馆中的学术文献和书籍信息。主要特征如下:... -
印尼新闻文本数据集IndonesianNewsTextDataset-rizkia14
印尼新闻文本数据集IndonesianNewsTextDataset-rizkia14 数据来源:互联网公开数据 标签:新闻文本,数据集,自然语言处理,印尼语,机器学习,文本分析,数据挖掘,信息处理 数据概述: 该数据集包含来自印尼新闻网站和媒体平台的新闻文本数据,记录了印尼各领域的新闻报道。主要特征如下:... -
书籍作者作品信息数据集BookAuthorWorkInformation-nico404
书籍作者作品信息数据集BookAuthorWorkInformation-nico404 数据来源:互联网公开数据 标签:书籍, 作者, 作品, 文学, 文本分析, 自然语言处理, 数据挖掘, 古腾堡项目 数据概述: 该数据集包含来自古腾堡项目的数据,记录了书籍的作者及其作品信息。主要特征如下: 时间跨度:数据未明确时间范围,可视为静态书籍信息。... -
英语写作水平评估与文本特征数据集EnglishWritingSkillAssessmentandTextFeatureDataset-hoangtranba
英语写作水平评估与文本特征数据集EnglishWritingSkillAssessmentandTextFeatureDataset-hoangtranba 数据来源:互联网公开数据 标签:英语写作, 文本分析, 可读性评估, 写作质量, 自然语言处理, 机器学习, 文本特征, 语言模型 数据概述:...