-
写作风格评估日志数据集WritingStyleAssessmentLogs-jianma4
写作风格评估日志数据集WritingStyleAssessmentLogs-jianma4 数据来源:互联网公开数据 标签:写作评估, 文本分析, 行为日志, 机器学习, 自然语言处理, 写作技巧, 学习行为, 数据建模 数据概述: 该数据集包含来自写作练习的详细日志数据,记录了用户在写作过程中的各种行为,以及对应的写作质量评分。主要特征如下:... -
俄罗斯求职者简历信息数据集RussianJobSeekersResumeInformation-sameelie
俄罗斯求职者简历信息数据集RussianJobSeekersResumeInformation-sameelie 数据来源:互联网公开数据 标签:简历数据, 俄罗斯, 劳动力市场, 职业发展, 招聘, 文本分析, 自然语言处理, 数据挖掘 数据概述:... -
俄罗斯新闻文本数据分析数据集RussianNewsTextDataAnalysis-asdasdsadasdsasdasd
俄罗斯新闻文本数据分析数据集RussianNewsTextDataAnalysis-asdasdsadasdsasdasd 数据来源:互联网公开数据 标签:新闻文本, 俄罗斯, 文本分析, 自然语言处理, 新闻内容, 文本分类, 信息检索, 舆情分析 数据概述:... -
餐饮菜单菜品信息数据集RestaurantMenuItemInformation-melanieroberts
餐饮菜单菜品信息数据集RestaurantMenuItemInformation-melanieroberts 数据来源:互联网公开数据 标签:餐饮, 菜单, 菜品, 食材, 菜品分类, 文本分析, 推荐系统, 数据挖掘 数据概述: 该数据集包含来自餐饮行业的数据,记录了餐厅菜单中的菜品信息。主要特征如下:... -
-
约会网站用户画像数据集DatingWebsiteUserProfiles-harish1306
约会网站用户画像数据集DatingWebsiteUserProfiles-harish1306 数据来源:互联网公开数据 标签:用户画像, 社交网络, 文本分析, 人口统计, 情感分析, 机器学习, 约会, 个人信息 数据概述: 该数据集包含来自约会网站的用户个人资料信息,记录了用户的基本信息、个人描述、生活习惯和偏好等。主要特征如下:... -
孟加拉语文本分割数据集BengaliTextSplitDataset-tushartalukder
孟加拉语文本分割数据集BengaliTextSplitDataset-tushartalukder 数据来源:互联网公开数据 标签:文本分割, 孟加拉语, 自然语言处理, 语料库, 文本分析, 机器翻译, 数据标注, 语言学 数据概述: 该数据集包含孟加拉语文本,记录了用于训练和评估文本分割模型的数据。主要特征如下:... -
电影推荐系统数据集MovieRecommendationSystemDataset-fabiandafat
电影推荐系统数据集MovieRecommendationSystemDataset-fabiandafat 数据来源:互联网公开数据 标签:电影推荐, 电影数据, 用户行为, 评分预测, 文本分析, 数据挖掘, 机器学习, 协同过滤 数据概述:... -
词向量共现关系分析数据集WordVectorCo-occurrenceRelationshipAnalysis-qsnlxy72
词向量共现关系分析数据集WordVectorCo-occurrenceRelationshipAnalysis-qsnlxy72 数据来源:互联网公开数据 标签:词向量, 自然语言处理, 文本分析, 共现矩阵, 词嵌入, 语义关系, 机器学习, 数据挖掘 数据概述: 该数据集包含用于词向量分析的文本数据,记录了词语之间的共现关系。主要特征如下:... -
文本流畅度评估数据集TextFluencyEvaluationDataset-chamecall
文本流畅度评估数据集TextFluencyEvaluationDataset-chamecall 数据来源:互联网公开数据 标签:文本分析, 语言流畅度, 文本摘要, 自然语言处理, 机器学习, 情感分析, 文本理解, 数据集构建 数据概述: 该数据集包含来自开放文本资源的数据,记录了用于评估文本流畅度的文本片段及其对应的流畅度评分。主要特征如下:... -
英语写作质量评估数据集EnglishWritingQualityAssessmentDataset-goldenlock
英语写作质量评估数据集EnglishWritingQualityAssessmentDataset-goldenlock 数据来源:互联网公开数据 标签:自然语言处理, 文本分析, 写作评估, 语言模型, 文本质量, 机器学习, 文本评分, 语言学 数据概述: 该数据集包含用于评估英语写作质量的相关数据,涵盖了文本评估的多个维度。主要特征如下:... -
柬埔寨新闻双语翻译数据集CambodiaNewsBilingualTranslationDataset-newmashedpotato
柬埔寨新闻双语翻译数据集CambodiaNewsBilingualTranslationDataset-newmashedpotato 数据来源:互联网公开数据 标签:机器翻译, 柬埔寨语, 英语, 双语语料, 新闻, 文本分析, 自然语言处理, 语言学 数据概述:... -
-
二手商品交易平台商品信息与图片数据集Second-handGoodsTradingPlatformProductInformationandImages-mikulel
二手商品交易平台商品信息与图片数据集Second-handGoodsTradingPlatformProductInformationandImages-mikulel 数据来源:互联网公开数据 标签:商品信息, 图像识别, 文本分析, 价格预测, 俄罗斯市场, 市场分析, 多模态数据, 商品推荐 数据概述:... -
问答社区问题质量评估数据集QuestionQualityAssessmentDataset-yiningyan366
问答社区问题质量评估数据集QuestionQualityAssessmentDataset-yiningyan366 数据来源:互联网公开数据 标签:问答社区, 问题质量, 自然语言处理, 文本分析, 标注数据, 机器翻译, 情感分析, 深度学习 数据概述: 该数据集包含来自Stack... -
学术论文文本内容分析数据集AcademicEssayTextContentAnalysis-gmhost
学术论文文本内容分析数据集AcademicEssayTextContentAnalysis-gmhost 数据来源:互联网公开数据 标签:学术论文, 文本分析, 内容挖掘, 自然语言处理, 语料库, 文本分类, 写作范例, 教育 数据概述:... -
上市公司高管薪酬与文本分析数据集ExecutiveCompensationandTextAnalysisDataset-lemonlulu
上市公司高管薪酬与文本分析数据集ExecutiveCompensationandTextAnalysisDataset-lemonlulu 数据来源:互联网公开数据 标签:高管薪酬, SEC文件, 文本分析, 公司治理, 财务分析, 合同类型, 机器学习, 企业管理 数据概述:... -
尼泊尔新闻文本摘要数据集NepalNewsTextSummarizationDataset-rajanghimire54
尼泊尔新闻文本摘要数据集NepalNewsTextSummarizationDataset-rajanghimire54 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 自然语言处理, 文本分析, 尼泊尔, 语料库, 标题生成, 机器翻译 数据概述:... -
社交问答网站匿名用户去匿名化研究数据集-tianbaojie
社交问答网站匿名用户去匿名化研究数据集-tianbaojie 数据来源:互联网公开数据 标签:社交问答,匿名用户,去匿名化,Zhihu,Quora,用户行为,文本分析,隐私保护,数据挖掘 数据概述:... -
网络钓鱼网址检测数据集PhishingURLDetectionDataset-xuanthantsbd
网络钓鱼网址检测数据集PhishingURLDetectionDataset-xuanthantsbd 数据来源:互联网公开数据 标签:网络钓鱼, 网址检测, 恶意网址, 机器学习, 文本分析, 安全防护, 数据标注, 二分类 数据概述: 该数据集包含来自网络安全研究和公开数据集的网址信息,记录了用于识别网络钓鱼攻击的URL样本。主要特征如下:...