来DataCastle,你可以这样为吃货界贡献力量


  国内知名大数据竞赛平台DataCastle,近日推出新竞赛——食品安全国家标准的精准化提取。这一次,DC平台将竞赛扩展到了NLP领域,于本月月初上线食品安全国家标准的精准化提取是算法类竞赛,参赛者需要将主办方提供的若干个国家或地区食品检验检疫标准提取出来,将非结构化数据转换成结构化数据,以便形成工具需要的数据集。

  这一次,数据极客们将为广大吃货而战!

  众所周知,所有食品在进入市场之前都会经过重重检查,该食品的每项对应指标都达到国家或地区标准后方能算作合格产品。当下食品安全问题频出、食品安全问题越来越多被公众提及和重视。为充分保障食品安全,国家或各地区也日渐出台并完善了相当一系列的食品安全标准。一方面,这些食品安全标准繁杂、细碎;与此同时,一种食品所涉及到的食品安全标准可能会达到几十上百种。对食品安全检验检疫人员来说,精准且快速的食品安全标准的提取有助于迅速检验检疫食品是否符合标准,提高食品监管效率,更大程度地保障的公众食品安全。

  Datacastle携手数之联科技集团,推出了暌违已久的新竞赛——食品安全国家标准的精准化提取。假想某地食药监局需要按照总局要求对食品、药品按照国家相关规定进行检验检疫,但标准众多、分类各异,一线检验检疫人员为了快速的检索出某一类食品药品相关国家、地方标准,需要快速了解检测检疫标准的工具,该工具的首要工作就是将存在于各个文档中的标准提取出来,将非结构化数据转换成结构化数据,以便形成工具需要的数据集。参赛者则需要提供这样一个能够迅速提取相关文档表格的工具。

  主办方提供的数据包括若干PDF格式的国家或地区的食品安全标准,标准分为通用标准与专业品类标准;参赛者需要从每一个pdf文件中监测到表格,并从表格中提取指定类别的内容;为便于评分,我们统一了分类标准,且给出了分类标准文件,每个类别由“大类-亚类-品种-细类”唯一确定;最终你提交的方案将采用准确率评分。

  虽说此次只是DC推出的练习赛,但含金量也是不容小觑,真实对接行业需求,解决行业痛点,满足你的“救世”情怀;文字识别与自然语言处理能力的展示,挖掘NLP  (Natural Language Processing)大神;优秀参赛者还可以得到大数据名企的实习OFFER,和知名大数据学者周涛一起上班!

  大赛将持续到7月10日,NLP大神们,是时候到DataCastle展现你真正的技术了,我知道你已经寂寞很久了。


AD:《极客网》企业会员火热招募中...

  • 写评论
  • 0