除了上面说的三个麻匪,还有图片传输压缩、算法和功耗的平衡、题库本身丰富度等等,“麻匪”漫山遍野,一眼望不到头。。。。
王杰雄发现,这不是“让子弹飞”,这根本就是“乱枪打死”。这一大堆事要是等一个人搞完,那恐怕人类都登陆火星了。他赶紧吹响“集结号”——跟领导申请把其他技术同事一个个拉上船,并肩作战。
没顾得上开神马“誓师大会”,技术攻坚组就这样紧急成立了。
埋头苦干一个月,这套搜索算法终于做出了雏形。夏雅曈他们赶紧拿来一些测试题目,结果是:这套算法的识别率只有友商的一半儿左右。。。
这个结果,如翔一般。
盘了盘,王杰雄发现根本原因还是整个搜索的链路太长——用户拍照的清晰程度、用户框选题目的精细度、文字识别的准确程度、文件传输中的压缩比例、题目搜索的比对算法,每一步都有一定的信息损耗。
这种长链路的问题就如同你玩过的那种传话游戏,一个同学传给另一个同学,他再把听到的内容传给下一个同学。传到最后,往往已经把“前门楼子”传成了“肩膀头子”。。。
然而,市场的竞争不等人,疫情笼罩下的2020年,你懂的,各大拍照搜题软件都在拼命激战抢夺用户。
果然,团队接到了来自领导层的惊天命令:自研搜题模块要在国庆节上线!this is an order,不容争辩。
王杰雄他们看看表,现在已经7月多了,过去论天过,现在就得论秒了。。。
(三)二营长,拿我的“核武器”来
夸克学习技术团队把吃奶的劲儿都使出来了,疯狂地优化这个“传话游戏”。
那段时间,王杰雄他们做梦都在想优化策略。但是,经常出现的结果是:一个优化策略上了之后,一半的题目解题率升高,另外一半儿的解题率反而下降,就像在游泳池里玩跷跷板,一个人浮出水面喘口气,对面那个人就被淹在水下冒泡了。。。
到后来,为了该用哪些优化策略,这群技术宅越讨论越急眼,眼看就要从说服变成睡服。他们干脆决定,兵分好几个小组,各自研究心仪的优化策略,最后再把这些技术叠加起来。
技术宅有技术宅的计划,世界另有计划:如此舍命狂奔,尽管和友商的解题率差距在缩小,但始终还是追不上。
夸克怎么说也是一个有牌面儿的搜索引擎,如果国庆节就这个亚子直接发布出去,那简直是所有人都不能忍受的公开处刑。
祸不单行。
进入暑期,夸克搜题的活跃度开始肉眼可见地下降。原因很简单——同学们放假了。即使是学霸,也不会凡尔赛到放假的时候也天天搜题吧。。。
那么,这些同学还会在9月份开学的时候如约回来吗?万一不回来,我们做了这么久的新搜题引擎给谁用呢?大家心里紧张得如同初恋的少男。
从8月最后几天开始,所有人都捂着眼睛,从指缝里看夸克后台搜题功能的用户人数有没有增长,就跟老韭菜看着自己的股票持仓一样:哀其不幸,怒其不争。
他们悲伤地发现,用户数并没有回到上学期期末的时候。。。
然而,就在他们确认自己要凉了的时候,9月5号左右,搜题的用户突然开始暴涨,势如破竹,很快就挣脱了之前的最高点。
又惊又喜的夏雅曈、王杰雄他们突然意识到,原来因为疫情的原因,全国的学校是错峰开学的,学霸们虽迟但到,直到9月上旬才马力全开。
诚如夸克学习的搜索框所言:我爱学习,学习使我快乐。
这下有两件事是板上钉钉了:第一,国庆节新引擎铁定是要发布了;第二,哪怕按国庆七天乐最后一天算,此时距离发布也只有一个月了。
怎么用一个月的时间把搜题质量提升到世界级水平?
技术团队对视一眼,貌似只有使用最后一个“核武器”了!
你还记得我们之前留了一个伏笔么?最开始,技术团队曾经绕过了第一个“麻匪”,文字识别系统(OCR)。