OpenAI现允许网站阻止其网络爬虫抓取数据,避免数据被用于训练AI模型
【资料图】
OpenAI近日推出了一项新功能,允许网站阻止其网络爬虫从其网站上抓取数据训练GPT模型,以解决可能涉及到的数据隐私和版权问题。网络爬虫是一种自动化的程序,可以在互联网上搜索和获取信息。OpenAI的网络爬虫名为GPTBot,其会以一定的频率访问各种网站,并将网页内容保存下来,用于训练GPT模型。 OpenAI表示,网站运营者可以通过在其网站的Robots.txt文件中禁止GPTBot的访问,或者通过屏蔽其IP地址,来阻止GPTBot从其网站上抓取数据。OpenAI还表示,“使用GPTBot用户代理抓取的网页可能会被用于改进未来的模型,并且会过滤掉那些需要付费访问、已知收集个人身份信息(PII)、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源,“允许GPTBot访问您的网站可以帮助AI模型变得更加准确,并提高它们的通用能力和安全性。” 然而,这并不会追溯性地从ChatGPT的训练数据中删除之前从网站上抓取的内容。互联网为大型语言模型(如OpenAI的GPT模型和谷歌的Bard)提供了大部分的训练数据,为AI训练获取数据已经变得越来越有争议。一些网站,包括Reddit和Twitter,已经采取措施打击AI公司免费使用其用户帖子的行为,而一些作者和其他创作者也因为涉嫌未经授权使用其作品而提起诉讼。
相关阅读
精彩推荐
- OpenAI现允许网站阻止其网络爬虫抓取数据,避免数据被用于训练AI模型
- 领航未来 体验非凡 三星Galaxy Z Fold5|Z Flip5品鉴会落地北京
- 7月来近300张监管罚单,贷款资金违规入楼市、买理财是处罚重点
- 《逆水寒手游》饮食习惯怎么做 人间任务饮食习惯任务攻略
- 双城论坛拍板29日?北市府:等上海方回覆
- 二十四节气顺序表口诀 二十四节日顺口溜
- 山东平原:全县供气区域逐步恢复供气
- 网贷欠12万没钱还自救手册
- 北上资金大幅抛售迈瑞医疗 机构博弈中兴通讯丨龙虎榜
- 彩金贵妃醉酒金币价格今天多少一克(2023年08月08日)
- 葬礼揸fit人粤语豆瓣(葬礼揸fit人演员表)
- 华是科技等设立新公司 经营范围含集成电路销售
- 投资有信心 创新有恒心 转型有决心——山东部分民营企业走访见闻
- 港珠澳大桥珠海公路口岸单日进出境车辆首次破万
- 江苏扬州:一场“争金夺银” 带来的“真金白银”
- 湘潭县充分发挥里手作用——4000名里手助力莲乡发展推进社会治理
- “不用担心汇率波动了!”
- 机器人(300024):8月7日北向资金减持79.86万股
- 倏怎么读 拼音_倏怎么读
- 联通网络app下载(联通网络)
- 怎么算成交量 怎样算成交率
- 汤臣倍健:公司未调整年初既定增长目标 全年维持收入双位数增长目标指引
- 二季度广州共享单车企业服务质量考评结果出炉:三家企业“公众满意度”均未达标
- 一夜涨价百万!二手房业主为何集体“上头”?
- 保利发展前7个月销售额约2678亿元,7月斥资逾百亿拿地
- 辰光医疗拟15万元购买林海洋持有的辰瞻医疗30%股权:进一步拓展公司产业链
- 测评2019传祺GS5尊享版好不好及传祺GS5的270T自动舒适版好吗
- 一条联通世界的“空中丝绸之路”
- 泰山区岱庙街道:提升能力强信心,集中攻坚破难题
- 自掏腰包网购业绩 “贴息揽储”为何屡禁不止?