我有两本字典,但为了简单起见,我将使用这两个:
>>> x = dict(a=1, b=2)
>>> y = dict(a=2, b=2)
现在,我想比较 x
中的每个 key, value
对在 y
中是否具有相同的对应值。所以我写了这个:
>>> for x_values, y_values in zip(x.iteritems(), y.iteritems()):
if x_values == y_values:
print 'Ok', x_values, y_values
else:
print 'Not', x_values, y_values
它的工作原理是返回一个 tuple
然后比较是否相等。
我的问题:
这个对吗?有一个更好的方法吗?最好不要速度,我说的是代码优雅。
更新:我忘了提到我必须检查有多少 key, value
对是相等的。
x == y
应该为真
x == y
应该为真:“字典比较相等当且仅当它们具有相同的 (key, value) 对(无论顺序如何)。顺序比较 ('<', '< ;=', '>=', '>') 引发 TypeError。”
如果您想知道两个字典中有多少值匹配,您应该这么说:)
也许是这样的:
shared_items = {k: x[k] for k in x if k in y and x[k] == y[k]}
print(len(shared_items))
您想要做的只是x==y
你这样做不是一个好主意,因为字典中的项目不应该有任何顺序。您可能正在比较 [('a',1),('b',1)]
和 [('b',1), ('a',1)]
(相同的字典,不同的顺序)。
例如,看到这个:
>>> x = dict(a=2, b=2,c=3, d=4)
>>> x
{'a': 2, 'c': 3, 'b': 2, 'd': 4}
>>> y = dict(b=2,c=3, d=4)
>>> y
{'c': 3, 'b': 2, 'd': 4}
>>> zip(x.iteritems(), y.iteritems())
[(('a', 2), ('c', 3)), (('c', 3), ('b', 2)), (('b', 2), ('d', 4))]
差异只有一项,但您的算法会看到所有项都不同
def dict_compare(d1, d2):
d1_keys = set(d1.keys())
d2_keys = set(d2.keys())
shared_keys = d1_keys.intersection(d2_keys)
added = d1_keys - d2_keys
removed = d2_keys - d1_keys
modified = {o : (d1[o], d2[o]) for o in shared_keys if d1[o] != d2[o]}
same = set(o for o in shared_keys if d1[o] == d2[o])
return added, removed, modified, same
x = dict(a=1, b=2)
y = dict(a=2, b=2)
added, removed, modified, same = dict_compare(x, y)
DataFrame
的设计不允许真实的比较(除非它的长度为 1),因为它们继承自 numpy.ndarray
。 - 归功于 stackoverflow.com/a/33307396/994076
dic1 == dic2
从 python docs:
以下示例都返回一个等于 {"one": 1, "two": 2, "three": 3} 的字典: >>> a = dict(one=1, two=2, three=3) >> > b = {'一': 1, '二': 2, '三': 3} >>> c = dict(zip(['一', '二', '三'], [1, 2, 3])) >>> d = dict([('two', 2), ('one', 1), ('three', 3)]) >>> e = dict({'three': 3 , '一': 1, '二': 2}) >>> a == b == c == d == e 真
在第一个示例中提供关键字参数仅适用于作为有效 Python 标识符的键。否则,可以使用任何有效的密钥。
比较对 python2
和 python3
有效。
OrderedDict != dict
由于似乎没有人提到 deepdiff
,为了完整起见,我将在此处添加它。我发现通常获取(嵌套)对象的差异非常方便:
安装
pip install deepdiff
示例代码
import deepdiff
import json
dict_1 = {
"a": 1,
"nested": {
"b": 1,
}
}
dict_2 = {
"a": 2,
"nested": {
"b": 2,
}
}
diff = deepdiff.DeepDiff(dict_1, dict_2)
print(json.dumps(diff, indent=4))
输出
{
"values_changed": {
"root['a']": {
"new_value": 2,
"old_value": 1
},
"root['nested']['b']": {
"new_value": 2,
"old_value": 1
}
}
}
关于漂亮打印结果以供检查的注意事项:如果两个 dicts 具有相同的属性键(如示例中可能具有不同的属性值),则上述代码有效。但是,如果存在 "extra"
属性是字典之一,则 json.dumps()
失败并显示
TypeError: Object of type PrettyOrderedSet is not JSON serializable
解决方案:使用 diff.to_json()
和 json.loads()
/ json.dumps()
进行漂亮打印:
import deepdiff
import json
dict_1 = {
"a": 1,
"nested": {
"b": 1,
},
"extra": 3
}
dict_2 = {
"a": 2,
"nested": {
"b": 2,
}
}
diff = deepdiff.DeepDiff(dict_1, dict_2)
print(json.dumps(json.loads(diff.to_json()), indent=4))
输出:
{
"dictionary_item_removed": [
"root['extra']"
],
"values_changed": {
"root['a']": {
"new_value": 2,
"old_value": 1
},
"root['nested']['b']": {
"new_value": 2,
"old_value": 1
}
}
}
替代方案:使用 pprint
,会产生不同的格式:
import pprint
# same code as above
pprint.pprint(diff, indent=4)
输出:
{ 'dictionary_item_removed': [root['extra']],
'values_changed': { "root['a']": { 'new_value': 2,
'old_value': 1},
"root['nested']['b']": { 'new_value': 2,
'old_value': 1}}}
我是 python 新手,但我最终做了类似于@mouad 的事情
unmatched_item = set(dict_1.items()) ^ set(dict_2.items())
len(unmatched_item) # should be 0
当两个字典中的元素相同时,XOR 运算符 (^
) 应该消除字典的所有元素。
{'a':{'b':1}}
给出 TypeError: unhashable type: 'dict'
)
只需使用:
assert cmp(dict1, dict2) == 0
dict1 == dict2
相同
cmp
已被删除(应视为 removed before。他们提出的替代方案:(a > b) - (a < b) == cmp(a, b)
用于功能等效(或更好的 __eq__
和 __hash__
)
TypeError
: unorderable types: dict() < dict()
如果您假设两个字典都仅包含简单值,@mouad 的答案很好。但是,如果您有包含字典的字典,则会出现异常,因为字典不可散列。
在我的脑海中,这样的事情可能会起作用:
def compare_dictionaries(dict1, dict2):
if dict1 is None or dict2 is None:
print('Nones')
return False
if (not isinstance(dict1, dict)) or (not isinstance(dict2, dict)):
print('Not dict')
return False
shared_keys = set(dict1.keys()) & set(dict2.keys())
if not ( len(shared_keys) == len(dict1.keys()) and len(shared_keys) == len(dict2.keys())):
print('Not all keys are shared')
return False
dicts_are_equal = True
for key in dict1.keys():
if isinstance(dict1[key], dict) or isinstance(dict2[key], dict):
dicts_are_equal = dicts_are_equal and compare_dictionaries(dict1[key], dict2[key])
else:
dicts_are_equal = dicts_are_equal and all(atleast_1d(dict1[key] == dict2[key]))
return dicts_are_equal
not isinstance(dict1, dict)
而不是 type(dict1) is not dict
,这将适用于基于 dict. Also, instead of
(dict1[key] == dict2[key]), you can do
all(atleast_1d(dict1[key] == dict2[ key]))` 至少可以处理数组。
dicts_are_equal
变为 false 时突破您的 for loop
。没有必要再继续下去了。
>>> dict2 = {"a": {"a": {"a": "b"}}} >>> dict1 = {"a": {"a": {"a": "b"}}} >>> dict1 == dict2 True >>> dict1 = {"a": {"a": {"a": "a"}}} >>> dict1 == dict2 False
另一种可能性,直到 OP 的最后一个注释,是比较转储为 JSON 的字典的哈希值(SHA
或 MD
)。构造哈希的方式保证如果它们相等,则源字符串也相等。这是非常快速且数学上合理的。
import json
import hashlib
def hash_dict(d):
return hashlib.sha1(json.dumps(d, sort_keys=True)).hexdigest()
x = dict(a=1, b=2)
y = dict(a=2, b=2)
z = dict(a=1, b=2)
print(hash_dict(x) == hash_dict(y))
print(hash_dict(x) == hash_dict(z))
json.dumps(d, sort_keys=True)
将为您提供规范的 JSON,以便您可以确定两个 dict 是等效的。这也取决于您要达到的目标。只要该值不是 JSON 可序列化的,它就会失败。对于谁说它效率低下,看看 ujson 项目。
功能精细IMO,清晰直观。但只是为了给你(另一个)答案,这就是我的目标:
def compare_dict(dict1, dict2):
for x1 in dict1.keys():
z = dict1.get(x1) == dict2.get(x1)
if not z:
print('key', x1)
print('value A', dict1.get(x1), '\nvalue B', dict2.get(x1))
print('-----\n')
可能对您或其他任何人有用..
编辑:
我已经创建了上述版本的递归版本..在其他答案中没有看到
def compare_dict(a, b):
# Compared two dictionaries..
# Posts things that are not equal..
res_compare = []
for k in set(list(a.keys()) + list(b.keys())):
if isinstance(a[k], dict):
z0 = compare_dict(a[k], b[k])
else:
z0 = a[k] == b[k]
z0_bool = np.all(z0)
res_compare.append(z0_bool)
if not z0_bool:
print(k, a[k], b[k])
return np.all(res_compare)
要测试两个字典的键和值是否相等:
def dicts_equal(d1,d2):
""" return True if all keys and values are the same """
return all(k in d2 and d1[k] == d2[k]
for k in d1) \
and all(k in d1 and d1[k] == d2[k]
for k in d2)
如果要返回不同的值,请以不同的方式编写:
def dict1_minus_d2(d1, d2):
""" return the subset of d1 where the keys don't exist in d2 or
the values in d2 are different, as a dict """
return {k,v for k,v in d1.items() if k in d2 and v == d2[k]}
您将不得不调用它两次,即
dict1_minus_d2(d1,d2).extend(dict1_minus_d2(d2,d1))
如今,与 == 进行简单比较就足够了(python 3.8)。即使您以不同的顺序比较相同的字典(最后一个示例)。最好的是,您不需要第三方包来完成此操作。
a = {'one': 'dog', 'two': 'cat', 'three': 'mouse'}
b = {'one': 'dog', 'two': 'cat', 'three': 'mouse'}
c = {'one': 'dog', 'two': 'cat', 'three': 'mouse'}
d = {'one': 'dog', 'two': 'cat', 'three': 'mouse', 'four': 'fish'}
e = {'one': 'cat', 'two': 'dog', 'three': 'mouse'}
f = {'one': 'dog', 'two': 'cat', 'three': 'mouse'}
g = {'two': 'cat', 'one': 'dog', 'three': 'mouse'}
h = {'one': 'dog', 'two': 'cat', 'three': 'mouse'}
print(a == b) # True
print(c == d) # False
print(e == f) # False
print(g == h) # True
代码
def equal(a, b):
type_a = type(a)
type_b = type(b)
if type_a != type_b:
return False
if isinstance(a, dict):
if len(a) != len(b):
return False
for key in a:
if key not in b:
return False
if not equal(a[key], b[key]):
return False
return True
elif isinstance(a, list):
if len(a) != len(b):
return False
while len(a):
x = a.pop()
index = indexof(x, b)
if index == -1:
return False
del b[index]
return True
else:
return a == b
def indexof(x, a):
for i in range(len(a)):
if equal(x, a[i]):
return i
return -1
测试
>>> a = {
'number': 1,
'list': ['one', 'two']
}
>>> b = {
'list': ['two', 'one'],
'number': 1
}
>>> equal(a, b)
True
对两个字典进行深度比较的最简单方法(也是其中一种更强大的方法)是以 JSON 格式序列化它们,对键进行排序,然后比较字符串结果:
import json
if json.dumps(x, sort_keys=True) == json.dumps(y, sort_keys=True):
... Do something ...
我正在使用这个在 Python 3 中非常适合我的解决方案
import logging
log = logging.getLogger(__name__)
...
def deep_compare(self,left, right, level=0):
if type(left) != type(right):
log.info("Exit 1 - Different types")
return False
elif type(left) is dict:
# Dict comparison
for key in left:
if key not in right:
log.info("Exit 2 - missing {} in right".format(key))
return False
else:
if not deep_compare(left[str(key)], right[str(key)], level +1 ):
log.info("Exit 3 - different children")
return False
return True
elif type(left) is list:
# List comparison
for key in left:
if key not in right:
log.info("Exit 4 - missing {} in right".format(key))
return False
else:
if not deep_compare(left[left.index(key)], right[right.index(key)], level +1 ):
log.info("Exit 5 - different children")
return False
return True
else:
# Other comparison
return left == right
return False
它比较 dict、list 和任何其他自己实现“==”运算符的类型。如果你需要比较其他不同的东西,你需要在“if tree”中添加一个新的分支。
希望有帮助。
对于python3:
data_set_a = dict_a.items()
data_set_b = dict_b.items()
difference_set = data_set_a ^ data_set_b
为什么不只遍历一个字典并在此过程中检查另一个字典(假设两个字典具有相同的键)?
x = dict(a=1, b=2)
y = dict(a=2, b=2)
for key, val in x.items():
if val == y[key]:
print ('Ok', val, y[key])
else:
print ('Not', val, y[key])
输出:
Not 1 2
Ok 2 2
在 PyUnit 中有一种方法可以很好地比较字典。我使用以下两个词典对其进行了测试,它完全符合您的要求。
d1 = {1: "value1",
2: [{"subKey1":"subValue1",
"subKey2":"subValue2"}]}
d2 = {1: "value1",
2: [{"subKey2":"subValue2",
"subKey1": "subValue1"}]
}
def assertDictEqual(self, d1, d2, msg=None):
self.assertIsInstance(d1, dict, 'First argument is not a dictionary')
self.assertIsInstance(d2, dict, 'Second argument is not a dictionary')
if d1 != d2:
standardMsg = '%s != %s' % (safe_repr(d1, True), safe_repr(d2, True))
diff = ('\n' + '\n'.join(difflib.ndiff(
pprint.pformat(d1).splitlines(),
pprint.pformat(d2).splitlines())))
standardMsg = self._truncateMessage(standardMsg, diff)
self.fail(self._formatMessage(msg, standardMsg))
我不建议将 unittest
导入您的生产代码。我的想法是 PyUnit 中的源代码可以重新加工以在生产中运行。它使用 pprint
来“漂亮地打印”字典。似乎很容易将此代码调整为“生产就绪”。
迟到总比没有好!
比较 Not_Equal 比比较 Equal 更有效。因此,如果在另一个 dict 中未找到一个 dict 中的任何键值,则两个 dict 不相等。下面的代码考虑到您可能会比较默认字典,因此使用 get 而不是 getitem []。
在 get 调用中使用一种随机值作为默认值,等于正在检索的键 - 以防万一字典在一个字典中有 None 作为值,而另一个字典中不存在该键。此外,为了提高效率,在 not in 条件之前检查了 get != 条件,因为您正在同时检查双方的键和值。
def Dicts_Not_Equal(first,second):
""" return True if both do not have same length or if any keys and values are not the same """
if len(first) == len(second):
for k in first:
if first.get(k) != second.get(k,k) or k not in second: return (True)
for k in second:
if first.get(k,k) != second.get(k) or k not in first: return (True)
return (False)
return (True)
>>> hash_1
{'a': 'foo', 'b': 'bar'}
>>> hash_2
{'a': 'foo', 'b': 'bar'}
>>> set_1 = set (hash_1.iteritems())
>>> set_1
set([('a', 'foo'), ('b', 'bar')])
>>> set_2 = set (hash_2.iteritems())
>>> set_2
set([('a', 'foo'), ('b', 'bar')])
>>> len (set_1.difference(set_2))
0
>>> if (len(set_1.difference(set_2)) | len(set_2.difference(set_1))) == False:
... print "The two hashes match."
...
The two hashes match.
>>> hash_2['c'] = 'baz'
>>> hash_2
{'a': 'foo', 'c': 'baz', 'b': 'bar'}
>>> if (len(set_1.difference(set_2)) | len(set_2.difference(set_1))) == False:
... print "The two hashes match."
...
>>>
>>> hash_2.pop('c')
'baz'
这是另一种选择:
>>> id(hash_1)
140640738806240
>>> id(hash_2)
140640738994848
因此,如您所见,这两个 id 是不同的。但是 rich comparison operators 似乎可以解决问题:
>>> hash_1 == hash_2
True
>>>
>>> hash_2
{'a': 'foo', 'b': 'bar'}
>>> set_2 = set (hash_2.iteritems())
>>> if (len(set_1.difference(set_2)) | len(set_2.difference(set_1))) == False:
... print "The two hashes match."
...
The two hashes match.
>>>
查看字典视图对象:https://docs.python.org/2/library/stdtypes.html#dict
这样,您可以从 dictView1 中减去 dictView2,它将返回一组在 dictView2 中不同的键/值对:
original = {'one':1,'two':2,'ACTION':'ADD'}
originalView=original.viewitems()
updatedDict = {'one':1,'two':2,'ACTION':'REPLACE'}
updatedDictView=updatedDict.viewitems()
delta=original | updatedDict
print delta
>>set([('ACTION', 'REPLACE')])
您可以将这些字典视图对象相交、联合、差异(如上所示)、对称差异。更好的?快点? - 不确定,但是标准库的一部分 - 这使它成为可移植性的一大优势
这是我的答案,使用递归方式:
def dict_equals(da, db):
if not isinstance(da, dict) or not isinstance(db, dict):
return False
if len(da) != len(db):
return False
for da_key in da:
if da_key not in db:
return False
if not isinstance(db[da_key], type(da[da_key])):
return False
if isinstance(da[da_key], dict):
res = dict_equals(da[da_key], db[da_key])
if res is False:
return False
elif da[da_key] != db[da_key]:
return False
return True
a = {1:{2:3, 'name': 'cc', "dd": {3:4, 21:"nm"}}}
b = {1:{2:3, 'name': 'cc', "dd": {3:4, 21:"nm"}}}
print dict_equals(a, b)
希望有帮助!
下面的代码将帮助您比较python中的dict列表
def compate_generic_types(object1, object2):
if isinstance(object1, str) and isinstance(object2, str):
return object1 == object2
elif isinstance(object1, unicode) and isinstance(object2, unicode):
return object1 == object2
elif isinstance(object1, bool) and isinstance(object2, bool):
return object1 == object2
elif isinstance(object1, int) and isinstance(object2, int):
return object1 == object2
elif isinstance(object1, float) and isinstance(object2, float):
return object1 == object2
elif isinstance(object1, float) and isinstance(object2, int):
return object1 == float(object2)
elif isinstance(object1, int) and isinstance(object2, float):
return float(object1) == object2
return True
def deep_list_compare(object1, object2):
retval = True
count = len(object1)
object1 = sorted(object1)
object2 = sorted(object2)
for x in range(count):
if isinstance(object1[x], dict) and isinstance(object2[x], dict):
retval = deep_dict_compare(object1[x], object2[x])
if retval is False:
print "Unable to match [{0}] element in list".format(x)
return False
elif isinstance(object1[x], list) and isinstance(object2[x], list):
retval = deep_list_compare(object1[x], object2[x])
if retval is False:
print "Unable to match [{0}] element in list".format(x)
return False
else:
retval = compate_generic_types(object1[x], object2[x])
if retval is False:
print "Unable to match [{0}] element in list".format(x)
return False
return retval
def deep_dict_compare(object1, object2):
retval = True
if len(object1) != len(object2):
return False
for k in object1.iterkeys():
obj1 = object1[k]
obj2 = object2[k]
if isinstance(obj1, list) and isinstance(obj2, list):
retval = deep_list_compare(obj1, obj2)
if retval is False:
print "Unable to match [{0}]".format(k)
return False
elif isinstance(obj1, dict) and isinstance(obj2, dict):
retval = deep_dict_compare(obj1, obj2)
if retval is False:
print "Unable to match [{0}]".format(k)
return False
else:
retval = compate_generic_types(obj1, obj2)
if retval is False:
print "Unable to match [{0}]".format(k)
return False
return retval
>>> x = {'a':1,'b':2,'c':3}
>>> x
{'a': 1, 'b': 2, 'c': 3}
>>> y = {'a':2,'b':4,'c':3}
>>> y
{'a': 2, 'b': 4, 'c': 3}
METHOD 1:
>>> common_item = x.items()&y.items() #using union,x.item()
>>> common_item
{('c', 3)}
METHOD 2:
>>> for i in x.items():
if i in y.items():
print('true')
else:
print('false')
false
false
true
在 Python 3.6 中,可以这样完成:-
if (len(dict_1)==len(dict_2):
for i in dict_1.items():
ret=bool(i in dict_2.items())
如果 dict_1 的所有项目都存在于 dict_2 中,则 ret 变量将为真
您可以通过以下方式编写自己的函数来找到它。
class Solution:
def find_if_dict_equal(self,dict1,dict2):
dict1_keys=list(dict1.keys())
dict2_keys=list(dict2.keys())
if len(dict1_keys)!=len(dict2_keys):
return False
for i in dict1_keys:
if i not in dict2 or dict2[i]!=dict1[i]:
return False
return True
def findAnagrams(self, s, p):
if len(s)<len(p):
return []
p_dict={}
for i in p:
if i not in p_dict:
p_dict[i]=0
p_dict[i]+=1
s_dict={}
final_list=[]
for i in s[:len(p)]:
if i not in s_dict:
s_dict[i]=0
s_dict[i]+=1
if self.find_if_dict_equal(s_dict,p_dict):
final_list.append(0)
for i in range(len(p),len(s)):
element_to_add=s[i]
element_to_remove=s[i-len(p)]
if element_to_add not in s_dict:
s_dict[element_to_add]=0
s_dict[element_to_add]+=1
s_dict[element_to_remove]-=1
if s_dict[element_to_remove]==0:
del s_dict[element_to_remove]
if self.find_if_dict_equal(s_dict,p_dict):
final_list.append(i-len(p)+1)
return final_list
我有一个默认/模板字典,我想从第二个给定字典更新它的值。因此,更新将发生在默认字典中存在的键上,并且如果相关值与默认键/值类型兼容。
不知何故,这类似于上面的问题。
我写了这个解决方案:
代码
def compDict(gDict, dDict):
gDictKeys = list(gDict.keys())
for gDictKey in gDictKeys:
try:
dDict[gDictKey]
except KeyError:
# Do the operation you wanted to do for "key not present in dict".
print(f'\nkey \'{gDictKey}\' does not exist! Dictionary key/value no set !!!\n')
else:
# check on type
if type(gDict[gDictKey]) == type(dDict[gDictKey]):
if type(dDict[gDictKey])==dict:
compDict(gDict[gDictKey],dDict[gDictKey])
else:
dDict[gDictKey] = gDict[gDictKey]
print('\n',dDict, 'update successful !!!\n')
else:
print(f'\nValue \'{gDict[gDictKey]}\' for \'{gDictKey}\' not a compatible data type !!!\n')
# default dictionary
dDict = {'A':str(),
'B':{'Ba':int(),'Bb':float()},
'C':list(),
}
# given dictionary
gDict = {'A':1234, 'a':'addio', 'C':['HELLO'], 'B':{'Ba':3,'Bb':'wrong'}}
compDict(gDict, dDict)
print('Updated default dictionry: ',dDict)
输出
'A' 的值 '1234' 不是兼容的数据类型!!!
键“a”不存在!字典键/值没有设置!!!
{'A': '', 'B': {'Ba': 0, 'Bb': 0.0}, 'C': ['HELLO']} 更新成功!!!
{'Ba': 3, 'Bb': 0.0} 更新成功!!!
“Bb”的值“错误”不是兼容的数据类型!!!
更新了默认字典:{'A': '', 'B': {'Ba': 3, 'Bb': 0.0}, 'C': ['HELLO']}
import json
if json.dumps(dict1) == json.dumps(dict2):
print("Equal")
json.dumps
在默认设置下是确定性的)。
list
键创建字典。x = {[1,2]: 2}
将失败。该问题已有有效的dicts
。list
键的“无效字典”不是有效的 Python 代码 - 字典 keys 必须是不可变的。因此,您不是在比较字典。如果您尝试使用列表作为字典键,您的代码将无法运行。您没有可比较的对象。这就像输入x = dict(23\;dfg&^*$^%$^$%^)
然后抱怨比较不适用于字典。当然它不会起作用。另一方面,Tim 的评论是关于可变values
,因此我说这些是不同的问题。set
要求值是可散列的,而dict
要求键是可散列的。set(x.keys())
将始终有效,因为键必须是可散列的,但set(x.values())
将在不可散列的值上失败。