正文

第53次编程比赛题目研究 2007-05-25 17:39:00

【评论】 【打印】 【字体: 】 本文链接:http://blog.pfan.cn/goal00001111/26135.html

分享到:

题目: 产生指定长度的无连续重复部分的字符串(所有元素都由'1','2','3'这三个字母构成)输入: 指定的长度n输出: 无函数接口:void unoverlap(int n, char *p)//p是已经分配好了的,不用担心溢出.例如:输入5输出 p中的内容应为12312(或满足条件的其它串)(不能输出12323,因为23和23是连在一起的并且相同)当然只要输出一个满足条件字符串的就可以了。 最容易想到的是回溯法,每放一个数字判断是否会产生重复,按'1','2','3'的顺序放置,如果都不满足,则回退一个。代码1如下:(取材于poorb的代码) bool Cover(char *base, int top)//判断是否有连续重复序列 {    int p;    int k = (top + 1) / 2;     for (int step=1; step<=top; step++)    {        for (p=0; p<step; ++p)        {            if (base[top-p] != base[top-step-p])                break;        }         if (p == step)//产生重复            return true;     }     return false;} void unoverlap(int n, char *p){    int now = 1;    p[0] = '1';     while (now < n)    {        p[now] = '1';         while (Cover(p, now))//如果出现连续重复序列         {            while (p[now] == '3')//若当前位置对所有字符都不满足,回退一个             {                --now;            }            p[now]++;        }        now++;    }} 也有直接写出序列的方法,crossbow说本题实际上是求Thue序列,也就是不匹配正则表达式.*\(.+\)\1.*的串。Axel Thue证明了存在无穷长度的Thue序列。构造Thue序列的办法是这样(假设字母表是{N,O,P}):从单个N开始,顺序扫描当前序列,见到一个N写下OP,见到一个O写下ONP,见到一个P写下N。新写下的序列就是一个更长的Thue序列。我们现在分别用1,2,3代替N,O,P,构造长度为n的Thue序列。类似倒水,对两个数组的分别求Thue序列,存储到新的数组中,将最后得到的Thue序列存储到p中 代码2如下: void unoverlap(int n, char *p){    char *a = new char[n+3];//临时数组,用来存储当前的Thue序列     int lable = 0;    int len = 0;    int top;    int i;        a[len++] = '1';//最初的Thue序列是单个的字符'1'     while (1)    {        top = 0;        for (i=0; i<len; ++i)//根据构造原理,由原Thue序列得到新的Thue序列,由a到p         {            if (a[i] == '1')            {                p[top++] = '2';                p[top++] = '3';            }            else if (a[i] == '2')            {                p[top++] = '2';                p[top++] = '1';                p[top++] = '3';            }            else                p[top++] = '1';                            if (top >= n)//如果已经得到足够长度的Thue序列,跳出循环                 break;        }        if (i < len)        {            lable = 1;//表示最终得到的Thue序列已经存储在数组p中             break;        }                    len = top;        top = 0;        for (i=0; i<len; ++i)//根据构造原理,由原Thue序列得到新的Thue序列,由p到a         {            if (p[i] == '1')            {                a[top++] = '2';                a[top++] = '3';            }            else if (p[i] == '2')            {                a[top++] = '2';                a[top++] = '1';                a[top++] = '3';            }            else                a[top++] = '1';                            if (top >= n)                break;        }        if (i < len)        {            lable = 2;//表示最终得到的Thue序列存储在数组a中,需要复制到p中             break;        }    }        if (lable == 2)//把Thue序列复制到p中     {        for (i=0; i<n; ++i)            p[i] = a[i];    }    p[n] = '\0';        delete []a;} yxs0001也提供了一种直接写入序列的方法,他是从01开始,0替换为01,1替换为10,继续下去得到无穷序列。将序列中的01写为'1',10写为'2',相同的写为'3',即可得到序列。附:雨中飞燕对此算法进行了数学证明。 按照此算法,可得到代码3:void unoverlap(int n, char *p){    char *a = new char[n+2];//临时数组,用来存储当前的yxs序列     int lable = 0;    int len = 0;    int top;    int i;        a[len++] = '0';    a[len++] = '1';//最初的yxs序列是01     while (1)    {        top = 0;        for (i=0; i<len; ++i)//根据构造原理,由原yxs序列得到新的yxs序列,由a到p         {            if (a[i] == '0')            {                p[top++] = '0';                p[top++] = '1';            }            else            {                p[top++] = '1';                p[top++] = '0';            }                            if (top > n)//如果已经得到足够长度的yxs序列,跳出循环                 break;        }        if (i < len)        {            lable = 1;//表示最终得到的yxs序列已经存储在数组p中             break;        }                    len = top;        top = 0;        for (i=0; i<len; ++i)//根据构造原理,由原yxs序列得到新的yxs序列,由p到a         {            if (p[i] == '0')            {                a[top++] = '0';                a[top++] = '1';            }            else             {                a[top++] = '1';                a[top++] = '0';            }                            if (top > n)                break;        }        if (i < len)        {            lable = 2;//表示最终得到的yxs序列存储在数组a中,需要复制到p中             break;        }    }        if (lable == 2)//把yxs序列复制到p中     {        for (i=0; i<top; ++i)            p[i] = a[i];    }        for (i=0; i<top; ++i)//按照转换原理,由yxs序列得到实际需要的序列     {        if (p[i] == p[i+1])            p[i] = '3';        else if (p[i] == '0')            p[i] = '1';        else            p[i] = '2';    }        p[n] = '\0';        delete []a;} 在构造yxs序列时,yxs0001并没有采用代码3的方法,而是进行了巧妙的变化----毕竟倒水算法时间复杂度太高,而且需要辅助空间。yxs0001利用yxs序列的特点:2个变4个,4个变8个,。。。直接写入yxs序列。但是yxs0001在构造yxs序列没有对代码进行优化,造成了很多重复计算。代码4如下: void unoverlap(int n, char *p){    int i, j;    p[0] = '0';    p[1] = '1';        for (i=2; i<=n/2; i*=2)//i表示当前yxs序列的长度,每处理一次,长度增倍     {        for (j=i-1; j>=0; j--)//出现重复计算,实际上j的值不必到0,只要到i/2就好了         {                        if (p[j] == '0')            {                p[2*j] = '0';                p[2*j+1] = '1';            }            else            {                p[2*j] = '1';                p[2*j+1] = '0';            }        }    }        if ((n & 1) == 0)//如果yxs序列的长度为偶数,需要多写一个元素     {        p[n] = p[n/2];    }        //补充没有被填写的空位,这里也有重复计算,实际上i的值只要取[n/4,(n-1)/2]就好了     for (i=(n-1)/2; i>=0; i--)    {        if (p[i] == '0')        {            p[2*i] = '0';            p[2*i+1] = '1';        }        else        {            p[2*i] = '1';            p[2*i+1] = '0';        }    }        for(int i = 0;i<n;i++)//按照转换原理,由yxs序列得到实际需要的序列     {        if (p[i] == p[i+1])            p[i] = '0';        else            p[i] = (p[i] - '0')*2 + p[i+1];           ++p[i]; //把012转化成123    }     p[n] = '\0';} 观察yxs序列的形成过程,其实我们很容易发现,yxs序列的构造还可以采用下面的方法:先令p[0] = '0';p[1] = '1'; 然后对下标i=[1,n/2]之间的所有元素,按规则为p[2*i]和p[2*i+1]赋值。这样得到的序列也是yxs序列。代码5如下: void unoverlap(int n, char *p){       p[0] = '0';    p[1] = '1';        for (int i=1; i<=n/2; i++)//先写入由0和1构成的yxs序列    {        if (p[i] == '0')        {            p[2*i] = '0';            p[2*i+1] = '1';        }        else        {            p[2*i] = '1';            p[2*i+1] = '0';        }    }        if ((n & 1) == 0)     {        p[n] = p[n/2];    }          for (int i=0; i<n; i++)//按照转换原理,由yxs序列得到实际需要的序列     {        if (p[i] == p[i+1])            p[i] = '0';        else            p[i] = (p[i] - '0')*2 + p[i+1];                    ++p[i]; //把012转化成123     }    p[n] = '\0';}很明显,代码5仍然是先实现yxs序列,但是弥补了代码4重复计算和需要补充空位的缺陷。 wangfangbob认为yxs序列貌似是几何分形,即以0 1开始每次取反码然后加在后面:0 10 1 1 00 1 1 0 1 0 0 10 1 1 0 1 0 0 1 1 0 0 1 0 1 1 0根据wangfangbob的算法也很容易得到yxs序列。代码6如下: void unoverlap(int n, char *p){       p[0] = '0';    p[1] = '1';        int len = 2;    while (len < n)    {        for (int i=0; i<len; ++i)//对当前序列取反码然后加在后面        {            if (len+i > n)                break;            if (p[i] == '0')                p[len+i] = '1';            else                p[len+i] = '0';        }        len *= 2;    }       if ((n & 1) == 0)     {        p[n] = p[n/2];    }          for (int i=0; i<n; ++i)//按照转换原理,由yxs序列得到实际需要的序列     {        if (p[i] == p[i+1])            p[i] = '3';        else if (p[i] == '0')            p[i] = '1';        else            p[i] = '2';    }    p[n] = '\0';} 在理解yxs序列的过程中,我总感觉由yxs序列转化成题目要求的序列采用的规则太麻烦,心想能否采用更简单的规则呢?于是尝试着采用如下更简单的规则:首先直接用字符'1'和'2'代替原来的'0'和'1';转换的规则是只改变原yxs序列中重复的两个相邻字符的后者。由于原yxs序列能够保证不会出现长度大于1的相同子串,所以由这个简单规则得到的序列也是一个无连续重复部分的字符串。 代码7如下: void unoverlap(int n, char *p){       p[0] = '1';    p[1] = '2';        for (int i=1; i<=n/2; i++)//先写入由1和2构成的yxs序列    {        if (p[i] == '1')//每隔i个数取相同的值,因为i是递增的,所以可以保证不会出现长度大于1的相同子串         {            p[2*i] = '1';            p[2*i+1] = '2';        }        else        {            p[2*i] = '2';            p[2*i+1] = '1';        }    }          for (int i=1; i<n; i++)//修正序列的值,把连续的两个相同值的后者改成第3个值就好了     {        if (p[i] == p[i-1])            p[i] = '3';    }    p[n] = '\0';} 注:虽然上述方法都能得到正确的字符串,但是字符串的内容却不相同。采用以下主函数生成字符串并判断字符串是否满足条件。(由小黑骑DK提供) #include <iostream>#include <time.h>using namespace std; void unoverlap(int n, char *p);int overlap(const char *p, int n);int test_str(const char *p, int n); int main(){ char a[20] = {0}; int n = 14;  unoverlap(n, a); puts(a); test_str(a, n);  getchar(); return 0;} //判断一个字符序列里是否有重复的部分 1为不满足条件int test_str(const char *p, int n){        int i = 2;     for (; i<n; i++)    {        if (overlap(p,i) == 1)        {            printf("\nWhich:%d\n", i);            return 1;        }    }     return 0;} //判断一个序列是否有连续重复的部分(以第n个字母结束的子串)int overlap(const char *p, int n){    int max = (n+1)/2;//如果有重复部分,则此长度是最大重复长度    int length = 1;    int end1, end2;//两个要比较的子串结尾     for (; length<=max; length++)    {        for (end1=n,end2=n-length; end1>n-length && p[end1]==p[end2]; end1--,end2--)            ;//比较两个子串        if (end1 == n-length)//两子串相同,表明有重复        {            printf("\nlength:%d\n",length);            return 1;        }    }     return 0;} 代码1 输出:12131231321231代码2 输出:21323121312321代码3 输出:13212313231213代码4 输出:21323121312321代码5 输出:21323121312321代码6 输出:13212313231213代码7 输出:12312132313212 测定速度;int main(){ time_t startTime; time_t endTime; time(&startTime);        for (int n=10000; n<20000; ++n){  char a[25000] = {0}; unoverlap(n, a);}  time(&endTime); cout << difftime(endTime, startTime) << endl;  getchar(); return 0;} 代码1 超时代码2 8秒 代码3 10秒 代码4 8秒 去掉重复计算可达到5秒 代码5 5秒代码6 5秒代码7 4秒 附上雨中飞燕的证明----- yxs0001的算法证明: 以n=20为例:源下标 0 1 2 3 4 5 6 7 8 91011121314151617181920对应串 1 2 2 1 2 1 1 2 2 1 1 2 1 2 2 1 2 1 1 2 1       \/\/\/\/\/\/\/\/\/\/\/\/\/\/\/\/\/\/\/\/\目标串  1 3 2 1 2 3 1 3 2 3 1 2 1 3 2 1 2 3 1 2 0 两个相邻对应串的字符决定一个目标串字符 1 2 -> 1 2 1 -> 211,22-> 3(对应的数可以随意) (下文?表示1个1或2)证明1:对应串不存在任意三个连续相同的数    对应串里的数两两分组,每组必然包含1和2;    因为任意三个连续的数必定包含一组,所以不存在 推论1:对应串不存在任意三个间距为1的相同的数(即1?1?1或者2?2?2)    或者,不存在任意三个间距为2^n-1的相同的数。    因为要出现1?1?1的必要条件是在它前面折半的位置出现三个连续相同的数    用数学归纳法,若间距是2^(n-1)-1不存在,可以得到间距是2^n-1也不存在(n>0) 证明2:对应串可能存在任意三个间距为2的相同的数,即形如1ab1AB1,但a!=A或者b!=B。    把它两两分组,假设是    1a b1 AB 1*    于是a=b=2,又因为A!=B,所以AB之中必有一个数与ab不相等    另一种分组法类似(成镜像),此处略,下同。 推论2:对应串可能存在任意三个间距为偶数的相同的数,形如1aaaa1bbbb1,但aaaa的内容与bbbb不全相同。    当间距是比2大的偶数的时候,假如是4,可表示为:    1abcd1ABCD1?    有类似分组为:    1a bc d1 AB CD 1?    所以,a=d=2,令A=D=2,得B=C=1,但因b!=c,矛盾;    当间距更大时,可以类似方法递推。所以满足这个条件的序列也不存在 推论3:对应串可能存在任意三个间距为非2^n-1形式的数的相同的数,但前半串与后半串不全相同。    这个证明简单,如果间距是奇数,如1?????1?????1,那么在前面折半的位置必然能找到    形如1??1??1这样的数,一直递降,最后必定出现证明2或者推论2的情况。 结论1:对应串中,任意三个间距为k的相同的数中:    k表达为2^n-1时,这样的序列不存在;    k不能表达为2^n-1时,中间所夹的两段子串不全相同。    或者可以表达为:对应串中不存在一对仅有一个公共元素且完全相同的子串。 结论2:由此对应串生成的目标串,不存在一对连续且相同的子串。 证毕。

阅读(3163) | 评论(0)


版权声明:编程爱好者网站为此博客服务提供商,如本文牵涉到版权问题,编程爱好者网站不承担相关责任,如有版权问题请直接与本文作者联系解决。谢谢!

评论

暂无评论
您需要登录后才能评论,请 登录 或者 注册