网站导航

导航

News

新闻资讯

分类

每周AI大事件苹果下多款AI应用、黑客版ChatGPT风靡暗网时间：2024-07-31 09:43:13

　　欢迎来到站长之家的[每周AI大事件]，这里记录了过去一周值得关注的AI领域热点内容，帮助大家更好地了解人工智能领域的动态和发展风向。

　　腾讯自研的“腾讯混元大模型”已经进入应用内测阶段。多位腾讯员工表示，他们最近收到了内部邮件邀请，可以通过网页或小程序体验混元大模型。腾讯内部多个业务也已经接入混元大模型进行测试。

　　吴欣鸿透露，目前美图自研视觉大模型已迭代到1.5版本，并应用于美图旗下多款产品。目前，美图在AI层面有多个成功实践案例。“AI绘画”系列涵盖文生图、文字融合、图生图、涂鸦生图、线稿上色、头像制作、宠物头像等功能。

　　DragonDiffusion 是一款基于扩散模型的图像编辑工具，旨在实现对图像进行精细化编辑。通过设计分类器引导的方法，DragonDiffusion 能够将编辑信号转化为梯度，通过特征对齐损失修改扩散模型的中间表示。

　　余承东在社交平台展示了一项新技术:他利用华为手机内置的小艺语音助手，写了一段发布会宣传文案。从该视频可以看出，小艺可以根据用户需求，自动生成文案等内容。而在小艺的回答下方有一行提示——“数据来源:由AI模型自动生成，可能存在疏漏，仅供参考”。华为鸿蒙4.0或将融入AI大模型的能力，使得小艺语音助手具备生成式AI的功能。

　　阿里云宣布开源通义千问70亿参数模型，包括通用模型Qwen-7B和对线B-Chat，两款模型均已上线魔搭社区，开源、免费、可商用。

　　多个AI相关App在苹果应用商店下架。据七麦监控数据显示，本次共有658款应用被下架，其中包含 Chat、AI、GPT 等关键词的应用较多。根据苹果官方通知，中国区的苹果应用商店不允许提供 ChatGPT 相关的服务。同时，相关开发者需提供专门的许可证，且需要向监管部门申请。

　　百度智能云千帆大模型平台已经完成了新一轮的升级，全面接入了包括LLaMA2全系列、ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等33个大模型，成为了国内拥有大模型最多的平台。

　　百度Apollo宣布长城汽车、亿咖通科技成为首批文心大模型智舱应用探索伙伴。百度Apollo已分别与长城汽车、亿咖通科技基于大模型能力围绕车载交互场景开展探索和实践，完成多项创新功能在量产车型平台上的验证，部分功能有望在长城、领克、smart等量产车型上率先落地。

　　互联网大厂百度已经实现了将其大型语言模型 ERNIE 应用于汽车领域的承诺，并与汽车制造商长城汽车和数字驾驶舱创造者 ECARX 展开合作。

　　10.淘宝AI装修功能“真能造”将全面上线月下旬内测的AI装修功能“线日的家装家居生态峰会上正式对外发布，届时功能将更加完善，并且在样板间UGC分享和用户交互功能等方面进一步迭代升级。

　　阿里云通义听悟近期上线了三大新功能，其中包括视频自动提取PPT、浏览器插件、钉钉和微信小程序。这些功能旨在帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容，从而提高职场人士和学生的工作学习效率。

　　:科大讯飞在投资者平台回应称，讯飞星火认知大模型V2.0升级发布会将于8月15日举办，届时会发布多模态生成、代码生成能力及行业产品等多项能力及应用。

　　《生成式人工智能服务管理暂行办法》将在8月15日起施行，《办法》明确，提供和使用生成式人工智能服务应当尊重他人合法权益，不得危害他人身心健康，不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益。

　　AI游戏教育与产业联盟专委会正式成立。浦东将在产业政策、运营规范、国际交流等方面，为AI和游戏产业的发展提供大力支持。

　　苹果公司在2023年度的研发上花费了226.1亿美元，首席执行官蒂姆·库克明确表示其中一部分支出是因为该公司正在开发生成式人工智能。库克表示:「多年来，我们一直在进行广泛的人工智能技术研究，包括生成式人工智能。我们将继续投资、创新，并以负责任的方式推进这些技术，以帮助丰富人们的生活。显然，我们在大量投资，并且这一点在你所看到的研发支出中得到了体现。」

　　国外知名博客门户网站最近宣布，他们将禁止100% 由人工智能（AI）生成内容的发布，坚称平台为 “人类写作的家园”。Medium要求所有 AI 生成的文本都必须在 Medium 上进行标注，否则将不会被展示

　　Elon Musk 疑似已经从 OpenAI 手中购买了域名 AI.com，将其用于他即将成立的 AI 公司 xAI。分析认为，此举可能是为了让自己的公司成为 AI 领域的中心，与 OpenAI 竞争。

　　澳大利亚新闻集团（News Corp Australia）执行主席Michael Miller透露，该公司每周使用生成式人工智能制作3000篇文章，生成数千个有关天气、燃油价格和交通状况的当地报道。最近，该新闻集团发布公告招聘生成式AI数据记者，要求会使用AI自动创建新闻内容。这在新闻领域属于比较新鲜的职位，同时新闻媒体的内容创作将迎来转型时期。

　　ChatGPT的开发者OpenAI已经向美国专利商标局（USPTO）提交了“GPT-5”的商标申请。这一消息是由商标律师Josh Gerben在推特上分享的。GPT-5被推测是OpenAI高级语言模型的下一个迭代，可能会代表自然语言处理和人工智能能力的重大进步。但是，GPT-5的具体功能和改进尚未得到OpenAI的正式确认。

　　谷歌正在尝试使用人工智能自动生成 YouTube 视频摘要。这些摘要只会出现在有限数量的英语视频旁边，并且只能由有限数量的用户观看。它们将出现在 YouTube 的观看和搜索页面上，旨在简要概述视频内容，而不取代人工编写的现有描述。

　　OpenAI 可能正在准备下一版本的 DALL-E AI 文本到图像生成器（称为 DALL-E3），并进行一系列 alpha 测试，这些测试现已向公众泄露。虽然测试版本显示了模型的潜力，但也暴露了一些潜在的问题，例如生成不适宜内容的风险。然而，这些问题有望在正式发布之前得到解决。

　　硅谷风司 Andreessen Horowitz 最近在开发者网站 GitHub 上发布了一份详细的指南，教人们如何从零开始构建一个 AI 伴侣机器人。Andreessen Horowitz在描述中写道:这些伴侣有很多可能的用例——浪漫（人工智能女朋友/男朋友）、友谊、娱乐、辅导等。该项目纯粹是为了成为开发者教程和入门堆栈那些对聊天机器人是如何构建感到好奇的人。

　　Kickstarter 近日宣布，对于使用生成式人工智能（AI）工具创作图像、文本或其他作品的项目，将要求其在项目页面上披露更多与 AI 相关的信息。

　　谷歌科学家使用 GPT-4聊天机器人来欺骗 AI-Guardian 图像分类器的防御措施，并提供了相应的代码。GPT-4成功击败了 AI-Guardian 的防御，并降低了其稳健性从98% 到8%。

　　Instagram正在开发新的AI功能，包括一个AI生成的图像检测器。这些新的生成式AI功能不仅可以提升用户在 Instagram 上的体验，还可以帮助打击虚假信息。

　　Stack Overflow 在开发者社区和人工智能之间进行了整合，推出了 OverflowAI。OverflowAI 引入了语义搜索，通过矢量数据库提供智能的响应，为开发者提供准确的问题解决方案。

　　研究表明，对于类似 OpenAI 的服务，由于计算成本的计量和计费方式，英语输入和输出比其他语言要便宜得多，其中简体中文的成本约为英语的两倍，西班牙语为英语的1.5倍，而掸语则要贵15倍。

　　谷歌推出了 Robotics Transformer2（RT2），这是一个视觉-语言-动作(VLA)模型，可以将文本和图像输出为机器人动作。谷歌表示，RT-2「让我们更接近机器人的未来。」「就像语言模型通过从网络上的文本进行训练来学习一般的思想和概念一样，RT-2通过从网络数据中传输知识，以指导机器人行为，」谷歌 DeepMind 的机器人主管 Vincent Vanhoucke 在一篇博文中解释道。「换句线能够与机器人交流。」

　　Adobe 正在构建 Firefly，其生成式 AI 模型系列，在 Photoshop 中加入了一个功能，正如该公司所描述的:「将图像扩展到原始边界之外」。这个名为「生成式扩展（Generative Expand）」的功能，在 Photoshop 的 beta 版本中可用，用户可以通过单击和拖动裁剪工具来扩展和调整图像，从而扩展画布。

　　Meta发布了一款开源人工智能（AI）工具AudioCraft(直译为音频技艺)，该工具可以帮助用户根据文本提示创作音乐和音频。Meta表示，这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉，可用文本内容生成高质量、逼线.图像编辑工具EditAnything:可编辑图像中的任何元素

　　EditAnything 是一款基于 Segment-Anything、ControlNet、StableDiffusion 等技术的图像编辑工具。它能够编辑和生成图像中的任何内容，包括对图像中的物体进行修改、添加、删除等操作，通过调整细节和布局来生成不同风格的图像。

　　Faceswap.dev 是一个免费开源的AI 换脸软件，可以在视频或图片中进行人脸替换。该软件旨在提供易于使用、高效、安全的 Deepfakes 工具，并致力于提高用户的道德和法律意识，防止滥用 AI 换脸技术。

　　香港大学计算机视觉与机器智能实验室（CVMI Lab）和 TCL AI Lab 的研究人员共同开发了一种名为 MarS3D 的轻量级模型，可以显著提升自动驾驶 AI 的物体运动状态判别能力。

　　Nvidia 研究人员推出了一种创新的文本到图像个性化方法，称为Perfusion。与大AI图片生成模型不同的是，Perfusion 只有100KB大小，训练时间短，只需要4分钟。

　　Deep Nostalgia 是一项使用机器学习来动画静态图像的技术，能够给照片中的人脸添加动画效果，让家族历史更生动。用户只需上传照片，Deep Nostalgia 就会应用预设的动作模板，创建高质量逼真的视频。目前该工具已完成超过1.06亿个动画，并持续增加。

　　Playground AI 是一款免费在线的绘画工具，不需要注册。用户可以每天绘制1000张作品。

　　Skybox AI 是一款由 Blockade Labs 开发的免费工具，可以一键生成360度全景图像。用户可以通过关键词描述来生成完整的3D 场景，包括建筑物、天空、地面、植被等。生成的场景逼真，并且用户可以通过手势工具在360度内切换视角，并免费下载图片到本地。

　　FraudGPT 是一种不受监管的聊天机器人，在暗网上流通，并被犯罪分子用来编写网络钓鱼电子邮件和开发恶意软件。这个软件是由名为 CanadianKingpin 的开发者提供，在多个暗网市场上销售。它的定价为每月200美元，但购买三个或六个月的订阅可以获得折扣，购买一年的访问权限需要1700美元。据称，称其已在地下平台上处理了3000多笔销售。

　　Do Not Pay 是由 GPT4支持的人工智能律师机器人，可以通过为停车罚单辩解、协商交易退款和分析财务交易来帮助用户节省金钱。其接受了西方主要国家消费者法律和法规的培训，可以撰写引用具体立法的有说服力的信件，并代表用户通过电子邮件发送给公司，从而为他们节省金钱。该机器人已在纽约和伦敦推翻了16万多张停车罚单。

　　Github官宣，Copilot模型升级，5年内80%的代码将自动生成。GitHub Copilot发布还不到两年，就已经为100多万的开发者，编写了46%的代码，并提高了55%的编码速度。

　　沃伦·巴菲特在接受 CNBC 采访时表达了对人工智能和 ChatGPT 的谨慎而又惊叹的态度。他承认自己对人工智能的了解还不足以对其进行投资，但他仍然看到了它在日常应用中的潜力。

　　根据调查，63% 的人担心使用生成式人工智能时侵犯版权问题，而41% 的人担心这些工具存在固有偏见。另外，83% 的人对需要跟上的工具数量感到困惑，92% 的人不相信科技公司能够进行自我监管。

　　苹果分析师郭明錤在新报告中指出，目前没有任何迹象显示苹果会在2024年推出生成式AI技术或将其结合至硬件。郭明錤预测，苹果不会在即将到来的财报电话会议上花太多时间去讨论 AI 相关事项。苹果内部已经在做类似GPT的产品，但对于如何将生成式AI技术应用至消费者产品，苹果仍未有清晰的策略。

　　IBM安全部门的2023年数据泄露成本报告提供了有力证据，证明投资人工智能、自动化和威胁情报可以缩短数据泄露的生命周期，降低数据泄露的成本，并在整个公司范围内建立更强大、更有韧性的安全姿态。

　　皮尤研究中心的一项发现显示，19% 的美国工人从事与人工智能高度「暴露」的工作，该研究使用了暴露一词，因为尚不清楚人工智能的影响是积极的还是消极的。最受影响的群体包括预算分析师、数据录入员、税务编制员、技术作家和网络开发人员等职业。但23% 的美国工人却几乎不受影响，这些岗位是人工智能无法轻易复制的一般体力劳动，比如理发师、洗碗工、消防员、管道工、保姆等。

　　在最新的 Markets Live Pulse 调查中，514位受访者中的77% 计划在未来六个月内增加对科技股的投资或保持现状。与此同时，不到10% 的人认为科技领域的泡沫很快就会破裂。一半的人不愿意自掏腰包购买 AI 工具来帮助他们的个人或业务生活，而大多数公司也没有计划在交易或投资中使用这些工具。

　　Gartner 最新的报告，2023年全球在客服中心技术、对话式人工智能和虚拟助手方面的支出预计将达到186亿美元，这与上一年相比的大幅增长16.2%。

　　研究显示，2021年全球人工智能芯片组市场估值约为455亿美元，该市场2022年至2031年，复合年增长率可能高达31.8%，到2031年，市场规模可能达到7174亿美元。

　　近日，一款名为 FraudGPT 的恶意 AI 工具在暗网上流通，被黑客用于编写钓鱼邮件和开发恶意软件。与传统黑客工具相比，FraudGPT 更简单、直接、高效，无论专业开发人员还是小白都能使用。它可以生成看似真实的钓鱼邮件和网站，诱骗用户泄露敏感信息，还能模仿人类对话，与用户建立信任，引诱他们泄露信息或执行有害操作。FraudGPT 基于 GPT-3的大型语言模型，在训练后可以生成合乎逻辑且与事实相符的欺诈性文本。

　　前特斯拉总监、OpenAI 大牛 Karpathy 表示，AI 智能体是未来发展的方向。智能体是大模型的身体，能在各个领域施展身手。国内团队也在发展智能体，联汇科技推出了基于大模型自主智能体 OmBot。智慧店长、文档处理、视频剪辑是智能体的主要应用场景。然而，智能体的商业化落地仍面临挑战，包括技术壁垒和 “松耦合” 路线。国内团队需要攻克这些难题，才能实现真正意义上的智能体。

　　3.被卖家追着跑，这一波AI商拍线年年末，OpenAI 推出 ChatGPT，引爆了 AI 商拍领域的热潮。AI 商拍工具通过利用 AI 技术帮助品牌生成高质量产品图片，节省了拍摄成本和时间。在静态产品图生成功能上，各产品的使用路径和功能相似，但还需在细节上做更多优化。AI 商拍工具的技术壁垒并不高，不同厂商采用不同的底层模型，如 WeShop 采用了开源的 Stable Diffusion。目前主要用户是中小卖家和档口卖家，大企业在融合 AI 产品方面还面临一些难题。

　　电影《芭比》票房飙升后，“芭比 AI 写真” 成为热门周边。通过名为 “45AI” 的小程序，用户上传照片后，花9.9元即可得到金发芭比写真。虽然有排队时间和成片效果等问题，但仍有很多人追捧。AI 写真小程序在社交媒体迅速走红，但也引发了争议，如用户隐私等问题。AI 写真被称为抢走摄影师饭碗，但摄影师认为 AI 写真还不能威胁到他们的生意，因为 AI 只能修图，而摄影师还有沟通和引导客人等重要环节。

　　AI初创公司Runway宣布，AI视频生成产品Gen-1和Gen-2已全面开放，任何人都可以注册一个账号免费尝试。通过使用 Gen-2和 Midjourney，创作者可以快速生成各种类型的短片，包括科幻、恐怖、以及对热门 IP 的二创等。具体玩法可阅读原文。

　　硅谷在人工智能领域获得了大量融资，但与中国的 AI 创业环境存在差异。硅谷重视技术创新和大模型能力，而中国更注重商业模式。目前硅谷投资热点主要集中在基础大模型层、中间层和垂直应用层。然而，硅谷的大模型公司主要以 OpenAI 为首，其他创业公司很少涉足该领域。相比之下，中国的 AI 创业者和投资人面临迷茫，且 “Copy to China” 的策略逐渐失灵。硅谷投资人更注重 OpenAI 和 B 端行业整合的 AI 公司，而中国的创业者和投资人应该注重发展中间层和独特的商业模式。

　　上半年市场热炒的人工智能主题受到怀疑，大模型的炒作势头或将结束。国内外初代 AIGC 企业开始裁员，部分公司经营不善导致停摆。虽然市面上推出了超过100款大模型产品，但行业泡沫混杂，未来只有少数企业能够成为市场赢家。

分享到：