V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
jrhu05
V2EX  ›  分享创造

WorksApplication 机试题求解心得

  •  
  •   jrhu05 · 2016-05-31 11:37:08 +08:00 · 2475 次点击
    这是一个创建于 2902 天前的主题,其中的信息可能已经有所发展或是发生改变。
    话说我都不知道该发到哪里,怎么没有编程、算法或者机试题之类的节点,/(ㄒoㄒ)/~~ 
      昨晚看完学校的晚会回实验室,发现几个同学在很激烈的讨论问题,然后听到了什么矩阵、特征向量。数学系出身的我一下子就被吸引住了,本着有好玩的就要凑个热闹的心态问了问,原来他们在讨论一道 WorksApplication (什么公司?没听说,好像很小的样子)的机试题,好像已经讨论了蛮长时间,然后说用什么很高大上的 01 字典树(我打的对的吧?),感觉好牛逼好屌的样子,结果一看题目,嗨,什么嘛。
      把题目扒下来给你们瞧瞧:
    Character Recognition

    Description

    Character recognition is the conversion of images into text. For now we consider each character in the picture is a N*M matrix with only zeros and ones, and we need to recognize K characters. You are to write a program to find minimal number of pixels so that we can recognize each character.

    For example, we have only two characters 'T' and 'L', and the matrix size is 3*3, we can think 'T' and 'L' are

    111     100

    010     100

    010     111

    so we can recognize the character with only bottom-left pixel, the answer is 1.

    Limits

    • Memory limit per test: 256 megabytes

    • Time limit per test: The faster the better

    • Input

    • The first line of input is three integers N, M, K (1 <= N, M <= 10, 2 <= K <= 6). Which represents the size of matrix and number of characters. Then is following K blocks, which represents the matrix. Notice that each block starts with a blank line and we guarantee that characters are different.

    • Output

    • You should output the minimum number of pixels, which is the answer.

    • Sample Test

    • input

    • 2 3 2



    • 111

    • 010



    • 100

    • 100

    • output

    • 1

      说白了就是输入若干个同型 01 矩阵,然后寻找最少的点数来区分这若干个矩阵。我刚开始感觉有点意思,结果越分析越觉着出题目的人是智障,容我慢慢道来。
      直接正面入手肯定是不行的,一个个组合即使输入矩阵数目不多那么组合起来也是很可怕的数目,穷举法什么的,最不优雅了。正面不行,咱们反其道而行,你不是找能用来区分的点么,我偏偏不找这些点,我找不能区分的点,我们装 B 一下称这种点为无用点( useless Point ),那么什么样的点是不可用的呢?设想一下集合的交集,两个几个相交的部分一定是不能用来区分两个集合的,因为大家都是一样的嘛,推广一下,也就是说无用点即为所有输入矩阵中值一样的那些个点。剩下就好办了哇,排除掉这些一定不能用的无用点,剩下的点都可以用来当做区别点组的组员,后面 2B 的事情就来了,根据编码规则,要区别 N 个矩阵,那么最少需要 log N (这里 log 以 2 为底,我不知道怎么写下标),那么我们只要判断可用点数目是否大于这个临界值不就行了么,如果大于那么输出 log N 向上取整的整数,如果小于,说明无法有足够的点来区分,咱就输出个 0 吧。关键,最最最 2B 的事情来了,小哥(让我帮忙做题目的同学的绰号)说输入的这些个矩阵一定是可以区分的,那照这样的话我直接输出那个 log N 向上取整的整数不就可以了么, 2333 。
      关于怎么找出无用点我是这么设计的,设立一个 N\*M 的矩阵(和输入矩阵同型),设该矩阵为 NB (嗯,牛 B 矩阵),然后矩阵中每个元素是一个长度为 2 的 int 数组,设为 a , a[0]的值表示该矩阵位不同输入矩阵中值为 1 的个数, a[1] 的值表示该矩阵位不同输入矩阵中值为 0 的个数,然后顺序扫描各个输入矩阵,分别判断每一位的值,相应的改变 NB 矩阵中对应的一维数组中的值。随后设立一个值为 N*M 的数,表示初始可用点数,接着遍历统计 NB 矩阵中各个位中的一维数组的两个位,只要有一个位的值和输入矩阵个数是一样的,即表明在这个位所有的输入矩阵的值是一样的(或 0 或 1 ),然后这个点就是无用点,初始可用点数减去 1 。一轮线性扫描后就得出了可用点个数,然后判断一下就 ok 了。
      我把思路告诉他之后,他说让我帮忙实现(喂喂,有这么厚颜无耻的么,笑),他说他只会 py 交易, c 和 java 都不大会,然后题目只能用 c/c++、 java 来提交,我没理他。然后他说“请你一顿饭,外加两鸡腿,还有饮料!帮不帮?”,我一听,有鸡腿还有饮料,“帮帮帮!”,然后花了一二十分钟编了出来,我很想直接 syso 一个 log N 向上取整的整数啊,可那样有点太二 B 了,还是老老实实写吧。
      然后代码如下,因为输入较小,所以也没做优化,渣代码,且有注释强迫症,轻喷(提交一次通过, accepted ):

      想看代码的可以戳这里: http://www.jerryfu.net/post/worksApplication-character-recognition.html

      然后今天早上,出于好奇搜了一下,我的妈呀,日本的啊,福利据说不错哇,好像还能免费去日本旅游啊。关键,关键,起薪 600w 啊,日元也不少啊,折算过来 35W 多啊,一年顶我两三年啊!!!
      他第二题说在网上找到类似的代码了,也过了,这样两道题目全部 accept ,进面试应该妥妥的了吧。
      我怎么觉得我被他一个鸡腿打发了有点亏啊……
      我也想去日本玩!我也想去 Works Application !我也要拿 600w ,哼!
    1 条回复    2016-06-04 23:01:08 +08:00
    jrhu05
        1
    jrhu05  
    OP
       2016-06-04 23:01:08 +08:00
    我的求解方法好像有点问题,被秒打脸, 2333 ,我就一智障,/(ㄒoㄒ)/~~
    可是为什么是 accepted
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2685 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 15:31 · PVG 23:31 · LAX 08:31 · JFK 11:31
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.