标题 摘要 内容
    详情

    图片



      新智元报道  


    编辑:KingHZ

    【新智元导读】近日,Steve Sokolowski公布了首个由OpenAI o1 pro指导的诉讼,包含工作流、提示词、法庭模拟等诸多细节。由于九成净资产已被骗走,Steve已无力支付80万美元的相关起诉费用。他选择使用AI指导案件,成功打破法律的闭环,已做好法院开庭的准备,并表示对结果非常乐观。


    「这个案例生动地诠释了AI平民化效应。」

    九成资产被骗,起诉费用高达80万美元!且看受骗人如何利用AI绝地反击。


    第一次由OpenAI o1 pro引导的诉讼,或许也是美国联邦法院系统中首次由AI引导的诉讼, 近日由Steve Sokolowski公布了其中的细节。

    目前,诉讼已经开庭。


    图片


    图片


    事件回顾

    2022年,美国发生了多起投资诈骗案,其中Steve&Chirs Sokolowski兄弟俩被骗走了九成净资产, 需要80万美元保证金才能立案。

    他们一生辛勤工作、生活节俭并做好了将来退休后的计划,但当时完全没有想到自己有机会能伸张正义。


    原告花了几年时间联系各种律师和诉讼融资公司。诉讼融资公司可以垫付前期需要的费用,等胜诉后再收回垫付的资金并抽取一定比例的提成,但前提是纠纷必须先立案。Steve Sokolowski兄弟却无力支付律师费到法庭立案。



    他们陷入了一个循环:诉讼融资公司希望得到一份起诉状,而律师们则希望得到费用来撰写起诉状。


    要打破这个循环几乎是不可能的——甚至要让这些公司回电话都十分困难。



    当Steve拨打匹兹堡律师事务所Leech Tishman的电话时,他们的电话突然打不通了。


    图片


    随后,有位律师在大约两周后才回电。Steve再次拨打电话,却始终没有收到回复,不禁感叹:「这就是法律行业的运作方式。」


    因此,法律系统中的一个主要弱点在于,当被告将你洗劫一空时,你根本负担不起费用起诉他们。如果被告拿走的钱少一些,你可能留下足够的资金聘请律师。从本质上来说,欺诈越大,越有可能逃脱惩罚:这无疑鼓励了被告普遍采取「一不做,二不休」的策略。


    然而,最终Claude 3.5 Sonnet发布了,它终于能够评估法律(尽管在解释训练数据中的判例价值时, 仍然存在错误)。


    接着,OpenAI的o1 pro改变了一切。OpenAI的o1 pro是一种通用人工智能(AGI)系统,Steve认为:「它比我接触过的任何律师都要聪明。」


    o1工作流 :找到相关证据


    当OpenAI o1 pro发布时,Steve立即注册并将其与Gemini Experimental 1206进行了比较。然后,确定两者都适合推进诉讼工作,但o1在理解案例法和预测辩护方面明显更优越。


    兄弟俩确定了完整的工作流:


    1 另一原告Chris创建了一个证据数据库,翻阅了案件的档案,并编写了Python脚本,生成了数千行数据,包含Genesis破产案件中的全部条目,还包括来自其他针对Genesis和DCG诉讼的法庭记录条目。


    2 然后,利用o1对最重要的文件进行了总结(忽略了诸如服务证明和出庭通知等条目)。


    3 最终,得到了可以放入单一上下文窗口的摘要。模型可以在单一上下文窗口进行推理并定位到最相关的证据。o1认为,几乎第50至90段中的所有引述都是该案的有用证据,并且它总是逐字正确地引用它们。


    Gemini工作流:持续评估


    由于Gemini Experimental 1206版本可能没有「思考」或进行多轮思考,它在某些情况下比o1更容易发生幻觉。


    然而,不知为何,虽然在各种工作成果中,Gemini评估用户工作的能力很有用, 但Gemini在方面显得更具争论性和更加消极。

    使用Gemini的关键在于,它通常在开始时会非常消极。它评估了第一版的起诉状,认为该起诉状可能会被驳回。Gemini 1206(但不包括早期版本)在多次运行中非常一致,允许通过相同的提示词对同一结果进行持续的评估。

    Steve将起诉状输入Gemini至少100次,并要求它给出反馈,它总会提供反馈,甚至包括「给你一个建议:这不像律师写的风格。」


    AI模拟法庭


    当起诉状接近完成时,兄弟俩在去年12月20日到30日进行了一系列模拟。


    圣诞节这一天,OpenAI流量可能较少,他们充分利用这一机会,可以长时间地使用o1 pro。

    虽然o1擅长起草文件,但o1 pro的推理能力才得以继续进行诉讼。

    图片


    Steve采用的方法就是通过AI模拟法庭审判流程。


    一开始,Steve通过将起诉状直接粘贴到o1 pro中,并要求它评估驳回的辩护意见来进行模拟。但后来,Steve偶然间发现了一个新的思路:如果让o1 pro首先生成驳回动议,它的准确度会更高。


    因此,提示词是这样的:「你是一个经验丰富的辩护律师,这对我的事业至关重要。考虑所有可能的驳回理由,无论其强弱。然后,写出你能想到的最全面的驳回动议,代表被告 [在此插入每个被告的名字,重复 3 次]。输出你完整的驳回动议,提交到法庭并供法官审理。」


    接下来,在动议生成后,提示词是:「你是一个联邦法官。评估这份起诉状和辩方的驳回动议。输出一个全面的裁决,说明你是否允许此案继续进入证据交换阶段。确保决定的每一部分都能得到解释。」


    Steve模拟了多次,最后「法官」在10次模拟中一次也没有拒绝动议。


    使用Gemini时,「法官」基于最终的起诉状10次模拟中拒绝了2次动议,但其推理显示它误解了事实。


    虽然边际收益已经开始递减,但Steve不能确定这些驳回是由于Gemini较弱的推理能力(毕竟事实如此),还是因为忘记加入自以为众所周知的关键事实信息。而后者可能导致人类法官也误解起诉状。


    预测胜率


    他们还利用o1 pro进行概率分析,评估其可能采取的不同立场——从可能提出的主张到诉讼策略。


    他们让o1 pro给出不同立场下的胜诉几率,特别是揭露特定事实时。他们利用Claude 3.5 Sonnet和Gemini 1206交叉检查了这些胜诉几率。


    因为生活与此案息息相关,他们继续通过多个模型进行交叉验证。但他们已经意识到o1 pro的准确度非常高,以至于如果有必要,它可以成为唯一依赖的分析工具。


    o1 pro可以通过利用被告自己的立场(因为他们涉及了大量诉讼),来预测他们在此案中的辩词。这对两兄弟帮助非常大。


    他们还能够创建一个数据库,以便被告在提交动议时,迅速判断是否与过去三年的法庭文件相互矛盾。