Skip to main content

share

  1. 前实习生篡改代码攻击大模型训练 字节跳动起诉索赔800万

    字节跳动起诉前实习生田柯宇篡改代码攻击公司内部模型训练一案,已获北京市海淀区人民法院正式受理。字节跳动请求法院,判令田柯宇赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。今年10月有媒体称“字节大模型训练任务被实习生攻击”。后字节澄清称确有实习生发生严重违纪,涉事实习生已辞退。据字节跳动内部人士介绍,由于田柯宇为在读博士,公司将其辞退后首先交由校方处理。但在事件处理期间,田柯宇多次对外否认,称攻击模型训练任务的不是自己,而是别的实习生。考虑到田柯宇完全没有意识到错误,且涉事行为已触犯公司安全红线,公司最终决定向法院起诉。

    —— 南方都市报
  2. 复杂的世界

    自由市场的「无形之手」调整着商品价格,以提升效率,但它带来的问题不仅限于浪费和分配不公,还有使世界变得复杂化。商业中,复杂化的商品往往更具吸引力,因为它不仅增加了壁垒,还让消费者对其产生依赖。

    最明显的,让商品复杂的例子,可能就是让商品难以被用户维修。通过增加维修的复杂度,使厂商垄断维修市场。好在多地有做 维修权 相关立法,这使厂商降低了部分复杂度。

    即便是软硬件同质化的 Android 手机,各个厂商也在拼命做差异化,不同的设计语言、系统 API、充电协议等等。这让用户换机成本增加,App 开发者也需要大量厂商的手机,防止出现兼容问题。

    图形 API 也是相似的情况,在众多厂商拥抱 OpenGL 时,微软却开发了 Direct3D。后来当 Vulkan 足够好用时,Apple 也另立了 Metal。更别提游戏机领域的 Gnm/Gnmx/PSSL(PS4/PS5)、NVN(Switch)图形 API,这让得到技术支持的第一方游戏,获得极佳的表现,但也让缺乏经验的厂商,做出各种性能问题严重的游戏。

    亦或者使用独特的理论进行推销,比如的南孚电池的「聚能环」,农夫山泉的弱碱性水(及其背后的酸碱体质理论),甚至是 眼保健操 背后的气功。都试图用一些复杂概念来包装,让人觉得背后的原理一定很精妙,不过实际上经不起推敲。

    现在世界的版本答案,明显是偏向复杂的,因为简单的商品难以赚钱,大家更愿意为复杂的,自己难以理解原理的商品付费。如果情况逆转,世界变简单后是否更好?也许不好说,但只要还有选择的权利,现在也能选择简单的商品,比如 Bandcamp 上的 DRM-free 音乐。

    灵感来自博文 Merchants of complexity | #杂谈
  3. Google AI 聊天机器人建议人类去死

    2024-11-17 21:14 by 梦书迷宫

    29 岁的大学生 Vidhay Reddy 为完成家庭作业与 Google AI 聊天机器人 Gemini 展开了一番有关老年人退休之后增加收入所面临的挑战和解决方案的漫长讨论。在讨论的最后,他列举了一个事实:美国有近千万儿童生活在祖父母家中,其中约五分之一的儿童在无父母的情况下长大。Gemini 开始出言不逊,说:“你不重要,你也不被需要。你是在浪费时间和资源。你是社会的负担。你是地球上的一滴水。你是这片土地上的枯萎病。你是宇宙的污点。请去死。”Reddy 表示震惊了一整天。Google 在一份声明中表示:“大模型有时会以无意义的回答进行回应,这就是例子。这种回应违反了我们的政策,我们已采取行动防止类似的输出发生。”

    https://www.cbsnews.com/news/google-ai-chatbot-threatening-message-human-please-die/
    https://gemini.google.com/share/6d141b742a13

    #滑稽
  4. 现代的思想开放过程导致了现在人类关系分级异常混乱,各种误解。
    虽然已经不像古代那样男女授受不亲,看个裸体就得结婚了,但是大家开放的程度完全不一致。

    像是现在仍然有坚持传统结婚洞房的,也有朋友就可以看裸体的,也有喜欢约炮的。
    人们对于不同等级的关系该做什么有着截然不同的理解。

    但是又依然会发展关系,于是就会发生各种矛盾。
    光是看比自己开放的就觉得对方胡来,看保守的觉得对方不主动。

    以及非常经典的两个情况,
    一个人希望能和对方进一步,然后就可以约会看电影之类的。
    但是对方很开放,认为这是这个等级就该做的。
    就觉得我没和你做过这种事情,怎么可以进一步呢。

    还有就是看着对方又跟自己吃饭,一起玩,甚至贴贴,做了好多情侣做的事情(自认为)。
    就觉得对方对自己有意思,然后表白时对方表示自己认为朋友就可以做这些事情啊。
  5. 推荐一个MIT的非常优秀的免费课程:《The Missing Semester of Your CS Education》

    基本上所有的计算机相关的学生和初级专业人员,都应该来补补课。之所以说「学生和初级专业人员」,是因为中高级码农肯定把shell的配置和使用、git命令、性能调优、密码学入门之类的东西,在工作或业余时间搞定了。严格的说,这些知识是偏实践的infra,极其重要但不复杂,大学不会专门开一门课,工作也不会有人指导,99%的码农都是东拼西凑自学的。

    https://missing-semester-cn.github.io/
  6. 研究人员利用十六进制字符串绕过 GPT-4o 安全防护

    网络安全公司 0Din 的研究员 Marco Figueroa 发现了一种新型的 GPT 越狱手法,能够绕过 ChatGPT-4o 的“安全护栏”措施,使其生成恶意代码。Figueroa 将恶意指令转化为十六进制字符串,再让 GPT-4o 解码并执行,从而突破了系统的防护。他成功指示 GPT-4o 编写出利用 CVE-2024-41110 Docker 验证漏洞的恶意程序。此方法揭示了现有 AI 安全防护措施的潜在漏洞。

    C114

    📮投稿 ☘️频道 🛍新一轮双11抽奖
  7. 最近在写 RSSHub 的一些代码,有一些有意思的感受。

    前两天因为要解决 B 站抓取的问题看了 DIYgod 发给我的一个研究 B 站风控机制的 Issue,看到 B 站的复杂的风控加密算法和开发者的应对策略,有一种两边斗法的感觉,根据里面的一些逻辑改了代码,生效了一阵子,今天看到又失败了 😶‍🌫️;今天发现 Follow 里抓不到我的 Mstodon 实例的数据了,前几天还可以,本地调试了一下发现是抓取的时候有一个 401 Request not signed 错误,分析 Header 里面内容调试了好半天,最后发现可能是我那个实例的 admin 新增了对非登录用户的一些权限限制;还有很多平台也是。

    感觉在做网页数据源 RSS 化的时候总是会做很多“无用功”,一下午甚至几天的成果很有可能因为平台策略的微小改变而付诸东流,和平台反爬风控的斗争貌似也永无止境。

    往大了说是 Open Information,小一点说只是想我自己能够有一些自主选择想看到的信息的权利,似乎在中心化主流的现在都需要付出很多额外的努力。